Vò Quúnh Thu Cao häc K18

tải về 1.12 Mb.

trang	4/6
Chuyển đổi dữ liệu	07.07.2016
Kích	1.12 Mb.
	#1368

1 2 3 4 5 6

load ANN.mat;

%Chuyen vi cac ma tran so lieu dau vao

[N,S]=size(Clearn); % o day ta co N= 5; S=151

[K,R]=size(Alearn); % o day ta co K=77; S= 151

% Xac dinh mang MLP bang phuong phap Fletcher-Reeves conjugate gradient

Ehoc= rand(120,1);

Ekt= rand(120,1);

for nhidden = 1:2:120

% cho so noron lop an thay doi tu 1 den 120 de tim cau truc mang toi uu

for nTimes = 1:1:10

% thuc hien tinh 10 lan cho moi lop an de tim gia tri co diem xuat phat tot nhat

Elearn = 0;

Etest=0;

Ehoc_try = rand(1,10);

Ekt_try = rand(1,10);

net = newff(minmax(Alearn),[nhidden 100 100 5],{'logsig' 'purelin' ‘logsig’ ‘purelin’},'traincgf');

% Thiet lap cac thong so cho qua trinh hoc cua mang

net.trainParam.goal=0.001;

net.trainParam.epochs = 100000;

net = train(net,Alearn,Clearn);

ylearn = sim(net,Alearn);

% gia tri dau ra cua lop mang ung voi E_learn

ytest = sim(net,Atest) ;

% Gia tri dau ra cua lop mang ung voi E_test

e_hoc = Clearn-ylearn;

%sai so cua qua trinh hoc

e_test = Ctest-ytest;

%sai so cua qua trinh kiem tra

% Tinh toan sai so

Elearn = sum(sum(e_hoc.*e_hoc));

Etest = sum(sum(e_test.*e_test));

% Tinh sai so Elearn cho mang duoc cat vao mot matran co 5 hang

Ehoc_try(nTimes) = Elearn;

%luu giu gia tri nay lai

% Tinh sai so Etest cho mang duoc cat vao ma tran co 5 hang

Ekt_try(nTimes) = Etest;

%luu giu gia tri nay lai

end

if Elearn > net.trainParam.goal

% Neu sai so Elearn > goal thi tiep tuc

continue

% con nguoc lai thi dung qua trinh hoc lai

end

break

Ehoc(nhidden,1)= min(Ehoc_try);

Ekt(nhidden,1) = min(Ekt_try);

end

% khoi hien thi su phu thuoc cua sai so va so lop an

for i=1:1:800;

plot(i,Ehoc(i,1),'*b-',i,Ekt(i,1),'+r:');

title('Sai so hoc va kiem tra cua mang MLP theo so luong Noron lop an');

xlabel('So Noron lop an');

ylabel('Sai so');

legend({'Sai so hoc Elearn','Sai so kiem tra Etest'});

grid on;

hold on;

end

% ket thuc chuong trinh

Sau khi thực hiện chạy chương trình ta thu được kết quả như sau:

Hình 13: Mô hình mạng nơron nhân tạo mạng truyền thẳng MLP với 4 lớp ẩn

Từ mô hình mạng nơron truyền thẳng ở trên, ta thấy thời gian luyện mạng rất lớn (55 phút) đó là do kích thước của tập số liệu là rất lớn (80x151) và (80x5), số nút đầu vào lên tới 151 nút, cần phải có nhiều thời gian để lan truyền sai số giữa các giá trị của nút ẩn sao cho sai số thu được ở đầu ra là nhỏ nhất. Nếu giảm kích thước của tập số liệu đầu vào từ 151 xuống giá trị nhỏ hơn 10 thì thời gian phân tích sẽ giảm hơn rất nhiều. Vì vậy chúng tôi tiếp tục Vì vậy cần xử lý số liệu bằng cách giảm kích thước tập số liệu trước khi nhập số liệu vào mạng nơron nhân tạo.

Hình 14: Đồ thị biểu diễn sự phụ thuộc của sai số MSE theo số bước học

Hình 15: Đồ thị biểu diễn sự phụ thuộc của sai số học và sai số kiểm tra vào số nơron lớp ẩn.

Mô hình ANN tối ưu dựa trên nguyên tắc lựa chọn số nút trong lớp ẩn đầu tiên sao cho giá trị sai số của mẫu học và mẫu kiểm tra là thấp nhất. Đồ thị trên hình 15 cho thấy, nếu số nơron lớp ẩn là 100 thì giá trị sai số học và sai số kiểm tra sẽ nhỏ gần bằng nhau. Do đó, chúng tôi chọn số nơron lớp ẩn là 100 để tiến hành luyện mạng và kiểm tra mạng theo chương trình dưới đây:

net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig' 'purelin'},'traincgf');

net.trainParam.goal=0.0001;

net.trainParam.epochs = 10000;

net = train(net,Alearn,Clearn);

ylearn = sim(net,Alearn);

ytest = sim(net,Atest);

saiso1 = 100*(ytest-Ctest)./Ctest;

3.2.2. Xây dựng thuật toán loại trừ giá trị đo bất thường (outlier)

Khi xây dựng ma trận nồng độ mẫu phân tích và mẫu kiểm tra xác định 5 cấu tử trong cùng 1 dung dịch, do trật tự thí nghiệm được bố trí một cách ngẫu nhiên và số thí nghiệm rất lớn nên kết quả thí nghiệm chắc chắn sẽ có sai số thô hay còn gọi là giá trị bất thường. Nếu không loại bỏ các thí nghiệm này sẽ dẫn tới quá trình phân tích dựa trân ma trận dung dịch chuẩn thu được thiếu chính xác.

Do đó chúng tôi đã tiến hành xây dựng thuật toán loại sai số thô trước khi tiến hành thực hiện quá trình phân tích thành phần chính. Quá trình loại sai số dựa trên việc đánh giá giá trị trung bình độ sai chuẩn tương đối của ma trận kiểm tra.

Đây là mô hình loại bỏ 1 số mẫu mà nghi ngờ mắc sai số tương đối lớn. Dựa vào mô hình hồi quy này, 20 dung dịch kiểm tra được sử dụng để đánh giá độ chính xác và phù hợp của mô hình thông qua giá trị độ sai chuẩn tương đối (relative standard error)

Trong đó C_ijlà nồng độ chuẩn của cấu tử thứ i trong mẫu j. nồng độ của cấu tử i trong mẫu j tính được từ mô hình.

Mẫu bị mắc sai số hệ thống là mẫu khi loại bỏ nó khỏi ma trận mẫu học thì bộ số liệu học còn lại sẽ cho sai số tương nhỏ. Vì vậy, mẫu nào mà khi loaịo bỏ nỏ làm cho giá trị RSE thấp thì mẫu đó càng kém chính xác, có ảnh hưởng nhiều tới mô hình ANN và nên loại bỏ để được RSE nhỏ.

Các bước tiến hành phương pháp trên như sau:

- Nhập ma trận 80 mẫu chuẩn và 20 mẫu để kiểm tra.

- Loại bỏ mẫu số 1 trong ma trận mẫu chuẩn thì chỉ còn 79 mẫu học, khi đó ma trận xlearn chỉ còn (79x151) và ma trận dlearn chỉ còn (79x5)

- Xây dựng mô hình ANN thông thường dựa trên 79 dung dịch chuẩn để tìm nồng độ của các mẫu kiểm tra khi có ma trận độ hấp thụ quang của mẫu kiểm tra.

- Tính toán giá trị trung bình độ sai chuẩn tương đối của tất cả các mẫu kiểm tra dựa trên công thức bằng excel. Mẫu nào làm giá trị RSE nhỏ hơn 1% tức là mẫu đó bị mắc sai số hệ thống.

- Tiến hành loại bỏ tương tự mẫu số 2, mẫu số 3…mẫu 80 với thuật toán trong Matlab như sau:

load mau1.mat; % mau 1 la mau trong do ma tran mau kiem tra bi loai bo gia

% mau so 1, chi con lai 79 mau. Nhu vay, neu mau 1 khong mac sai so tho

% thi gia tri do sai chuan cua mau kiem tra se lon do mau 1 co anh huong

% mo hinh ANN

net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig' 'purelin'},'traincgf');

net.trainParam.goal=0.0000001;

net.trainParam.epochs = 300000;

net = train(net,Alearn,Clearn);

ylearn = sim(net,Alearn);

ytest = sim(net,Atest);

saiso1 = 100*(ytest-Ctest)./Ctest;

load mau2.mat;

net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig' 'purelin'},'traincgf');

net.trainParam.goal=0.0000001;

net.trainParam.epochs = 300000;

net = train(net,Alearn,Clearn);

ylearn = sim(net,Alearn);

ytest = sim(net,Atest);

saiso2 = 100*(ytest-Ctest)./Ctest;

load mau3.mat;

net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig' 'purelin'},'traincgf');

net.trainParam.goal=0.0000001;

net.trainParam.epochs = 300000;

net = train(net,Alearn,Clearn);

ylearn = sim(net,Alearn);

ytest = sim(net,Atest);

saiso3 = 100*(ytest-Ctest)./Ctest;

……

Sau khi thu được các giá trị sai số tương đối, nhập dữ liệu trên vào phần mềm excel để tính toán giá trị độ sai chuẩn tương đối. Giá trị độ sai chuẩn tương đối thu được ở bảng 7:

Bảng 7: Khảo sát sơ bộ độ sai chuẩn tương đối trung bình RSE của các mẫu kiểm tra

STT mẫu	RSE (%)	STT mẫu	RSE (%)	STT mẫu	RSE(%)
1	1,1027	28	2,1432	55	0,9345
2	6,5147	29	2,4562	56	7,2459
3	3,5476	30	3,4566	57	2,1234
4	1,2874	31	5,2355	58	3,0596
5	1,8863	32	4,2342	59	4,1949
6	1,3534	33	2,1432	60	3,1946
7	5,3936	34	4,6867	61	2,1948
8	2,5653	35	3,2512	62	6,1395
9	3,8875	36	5,5678	63	7,1252
10	2,3546	37	1,2738	64	2,2495
11	4,0415	38	2,3957	65	3,0184
12	5,9181	39	3,1480	66	2,3594
13	3,8006	40	4,3579	67	11,4567
14	11,1977	41	3,2658	68	8,4359
15	3,9807	42	2,1479	69	1,153294
16	5,1383	43	5,2568	70	3,8271
17	5,4388	44	6,2567	71	3,8271
18	4,8931	45	3,9376	72	4,5764
19	0,3647	46	0,2859	73	7,5594
20	4,7868	47	2,9859	74	4,4158
21	2,3464	48	9,2578	75	5,8491
22	7,1353	49	4,1035	76	5,6077
23	4,6877	50	3,1056	77	20,4685
24	1,3454	51	2,1349	78	3,0289
25	5,3254	52	2,5082	79	6,6760
26	8,2355	53	6,2068	80	3,93347
27	0,1243	54	7,9375

Dựa vào bảng 7 chúng tôi nhận thấy nếu bỏ mẫu 19, 27, 46 thì kết quả mẫu học sẽ cho sai số thấp nhất, do đó chúng tôi loại bỏ 3 mẫu trên, và tiến hành tính toán lại dựa trên mô hình ANN, khi đó ma trận mẫu học chỉ còn lại là 77x5.

3.3. Phương pháp mạng noron nhân tạo kết hợp với hồi quy thành phần chính (PCR-ANN) xác định đồng thời 5 cấu tử trong dung dịch.

Mục tiêu của luận văn là nghiên cứu xây dựng thuật toán PCR-ANN và áp dụng phần mềm MATLAB để giải quyết bài toán phân tích đồng thời nhiều cấu tử trong cùng hỗn hợp trên cơ sở giảm kích thước của tập số liệu nên chúng tôi chỉ tiến hành nghiên cứu phương pháp xác định với các dung dịch mẫu tự tạo đã biết sẵn nồng độ của 5 ion kim loại và không có ion lạ ngoài các ion cần phân tích. Ảnh hưởng của các chất cản trở được xem như ảnh hưởng nền mẫu.

Đối với phương pháp hồi quy đa biến phi tuyến tính, các thuật toán có phức tạp hơn, bộ số liệu sử dụng vẫn như trên, tuy nhiên các ma trận số liệu đó có kích thước rất lớn, thời gian luyện mạng kéo dài. Để giảm kích thước của tập số liệu, chúng tôi tiến hành sử dụng phương pháp phân tích cấu tử chính. Ma trận độ hấp thụ quang được chuyển sang 1 hệ tọa độ khác, tại đó, chỉ có 1 số cấu tử ảnh hưởng trực tiếp đến nồng độ của các ion kim loại khảo sát (cấu tử chính). Do đó, thiết lập được 1 ma trận đầu vào của mạng noron nhân tạo có kích thước nhở hơn, làm đơn giản hóa mô hình tính toán và kết quả thu được có độ chính xác cao hơn.

3.3.1. Khảo sát xây dựng mô hình PCA tối ưu.

- Tiến hành nhập ma trận nồng độ và ma trận độ hấp thụ quang của 80 mẫu chuẩn vào chương trình PCA đã dựng sẵn để xây dựng mô hình hồi quy đa biến trên cơ sở phân tích cấu tử chính nhằm giảm kích thước tập số liệu.

- Sau khi dùng phương pháp ANN đánh giá sơ bộ, loại trừ các mẫu mắc sai số thô, ảnh hưởng tới kết quả quá trình phân tích. Bộ số liệu học gồm ma trận nồng độ của các dung dịch chuẩn chỉ còn kích thước 77x5 và ma trận độ hấp thụ quang có kích thước 77x151.

Nhập ma trận độ hấp thụ quang của mẫu học và mẫu kiểm tra Ao (mxn) trong đó m hàng là số mẫu chuẩn bị ( m= 77+20= 97, n cột là số bước sóng (n=151).
Chuẩn hóa tập số liệu đầu vào: stdr = std(Ao) ;
Chuyển tập số liệu sang 1 tọa độ mới: sr = Ao./repmat(stdr,100,1);
Tính toán các giá trị tải trọng (loading) và trị số (score), phương sai (var)

[PCALoadings, PCAScores, PCAVar] = princomp(sr);

Tính tổng giá trị phương sai tích lũy trên các cấu tử: cumsum(PCAVar./sum(PCAVar) * 100);

Sau khi tính toán vecto cột chứa giá trị phần trăm phương sai tích lũy gồm 151 hàng (tương ứng với 151 bước sóng) thu được như bảng 8 sau:

Bảng 8: Giá trị phương sai tích lũy ứng với 151 cấu tử

Cấu tử	Giá trị phương sai tích lũy
1	61,0620135980013
2	94,6386206361863
3	99,4701457087665
4	99,9047763641201
5	99,9675941164431
6	99,9846263560543
7	99,9961983769519
8	99,9968829228295
9	99,9974242980017
10	99,9976864025098
11	99,9978870269475
12	99,9980840753909
13	99,9982529434438
14	99,9984155586119
15	99,9985570592987
…..	….

Bảng 8 thực tế có 151 cấu tử, tương ứng với 151 bước sóng. Sau khi dùng PCA từ ma trận độ hấp thụ quang 97x151 về nguyên tắc sẽ thu được 151 cấu tử (PC) nhưng kết quả cho thấy cấu tử 1 (PC1) đã chiếm 61,06% lượng thông tin của tập dữ liệu, nếu thêm cấu tử thứ hai (PC2) thì phương sai tích lũy đã đạt 94,64%. Khi thêm một cấu tử nữa (PC3) thì 3 cấu tử đầu này đã chiếm 99,47% lượng thông tin tập dữ liệu. Từ cấu tử thứ 4 trở đi lượng thông tin thu được tăng không đáng kể.

Từ kết quả trên cho thấy, 3 cấu tử ban đầu có ảnh hưởng chính tới các thông tin chứa trong tập số liệu. Bảng 16 là độ sai chuẩn tương đối RSE(%) tùy thuộc vào số cấu tử chính đã chọn.

Bảng 9 : Sự phụ thuộc của RSE vào số cấu tử chính khi phân tích mẫu kiểm tra

Số cấu tử (PC)

1

2

3

4

5

RSE(%)

26,86

3,14

4,00

4,20

5,07

Kết quả ở bảng 8 cho thấy nếu mô hình ANN chỉ chọn 1 cấu tử làm số nút lớp nhập thì sai số rất lớn là do cấu tử 1 chỉ chiếm khoảng 64% lượng thông tin của tập dữ liệu ban đầu. Với lượng thông tin đó, rất khó để thiết lập mô hình ANN phù hợp để xác định đồng thời cả 5 cấu tử.

Tuy nhiên, nếu tăng số cấu tử lên 3, 4 hoặc 5 thì sai số RSE tăng là do lượng thông tin chứa trong các cấu tử thứ 3, thứ 4 và thứ 5 không ảnh hưởng nhiều tới tập dữ liệu ban đầu trong khi kích thước tập số liệu lại tăng, vì vậy chúng tôi đã lựa chọn chỉ 2 cấu tử chính cho các bước nghiên cứu tiếp theo. Như vậy, tập dữ liệu ban đầu từ kích thước 97x151 cấu tử (ma trận độ hấp thụ quang) được chuyển về kích thước nhỏ hơn, chỉ còn 97x2 ( ma trận trị số (score) của 97 dung dịch chuẩn và kiểm tra và 2 PC).

3.3.2. Xây dựng mô hình PCR- ANN

* Xây dựng mô hình tìm số cấu tử chính (PCA) :

- Nhập toàn bộ giá trị ma trận độ hấp thụ quang của dung dịch chuẩn và dung dịch kiểm tra thành ma trận Ao (97x151) (97 là số mẫu của dung dịch chuẩn và dung dịch kiểm tra, 151 là số bước sóng khảo sát) để phân tích cấu tử chính (PCA).

- Chuẩn hóa tập số liệu đầu vào:

stdr = std(Ao) ;

Chuyển tập số liệu sang 1 tọa độ mới:

sr = Ao./repmat(stdr,100,1);

Tính toán các giá trị tải trọng (loading) và trị số (score), phương sai tích lũy (var)

[PCALoadings, PCAScores, PCAVar] = princomp(sr);

- Do số cấu tử chính tối ưu là 2, tách 2 cột đầu tiên trong ma trận trị số PCAScores làm dữ liệu đầu vào trong mô hình ANN, thu được ma trận mới A’o( 2x97) (97 là số mẫu dung dịch chuẩn và dung dịch kiểm tra, 2 là số cấu tử chính tối ưu)

* Xây dựng mô hình ANN dựa vào tập số liệu PCA vừa phân tích được.

+ Nhập ma trận đầu vào mẫu học Clearn(5x77) của 77 dung dịch chuẩn chứa 5 ion kim loại cần phân tích (5 hàng, 77 cột).

+ Nhập ma trận đầu ra mẫu học Alearn(2x77) (2 là số cấu tử chính thu được khi phân tích PCA). Ma trận này lấy từ 77 cột đầu tiên của ma trận A’o.

+ Nhập ma trận nồng độ mẫu kiểm tra Ctest(5x20) của 20 dung dịch chuẩn chứa 5 cấu tử (5 hàng, 20 cột).

+ Nhập ma trận đầu ra mẫu kiểm tra Atest(2x20). Ma trận này lấy từ 20 cột cuối cùng của ma trận A’o.

+ Tính toán số liệu theo mô hình ANN tối ưu đã khảo sát

net = newff(minmax(Alearn),[100 100 100 100 5],{'logsig' 'logsig' 'purelin' 'logsig' 'purelin'},'traincgf');

net.trainParam.goal=0.0000001;

net.trainParam.epochs = 300000;

net = train(net,Alearn,Clearn);

ylearn = sim(net,Alearn);

ytest = sim(net,Atest);

saiso = 100*(ytest-Ctest)./Ctest;

- Lưu lại M-file vừa thực hiện được mang tên:PCR- ANN.m

Sau khi tính toán, kết quả thu được từ mô hình sẽ là giá trị

+ ylearn : nồng độ của các mẫu học sau quá trình luyện mạng (learning).

+ ytest : nồng độ các mẫu kiểm tra sau quá trình học của mạng (trainning)

+ sai số tương đối của các mẫu kiểm tra sau quá trình học mạng

Thời gian luyện mạng được biểu diễn ở hình 16. Nồng độ và sai số tương đối của các mẫu kiểm tra sau quá trình học mạng được biểu diễn ở bảng 10

Hình 16 : Mô hình luyện mạng nơron nhân tạo sau khi đã phân tích thành phần chính.

Như vậy, nếu giảm kích thước tập số liệu thì thời gian tính toán của mô hình đã được giảm từ 55 phút xuống còn 5phút46 giây.

Bảng 10: Bảng so sánh nồng độ của các ion kim loại thu được từ mô hìnhANN và mô hình PCR-ANN

Mẫu	Nồng độ dung dịch kiểm tra (mg/l)					Nồng độ dung dịch thu được từ mô hình ANN (mg/l)					Nồng độ dung dịch thu được từ mô hình PCR-ANN (mg/l)
	Cu	Ni	Co	Pb	Cd	Cu	Ni	Co	Pb	Cd	Cu	Ni	Co	Pb	Cd
1	0,4	0	0,4	3	0,4	0,342	0,010	0,422	2,972	0,382	0,386	0,001	0,415	3,006	0,389
2	0,4	0,6	0	1	0,4	0,415	0,614	0,032	1,002	0,362	0,408	0,604	0,002	1,010	0,393
3	0,6	0,2	0,2	0	0,4	0,489	0,189	0,330	-0,024	0,377	0,606	0,190	0,200	0,001	0,395
4	0,4	0,2	0,4	3	0	0,381	0,211	0,360	3,028	-0,003	0,400	0,216	0,401	3,000	0,007
5	0	0,4	0	0	1,2	0,009	0,370	-0,010	0,011	1,190	0,007	0,400	0,009	0,007	1,189
6	0	0,2	1	0	0	0,036	0,201	0,964	0,001	0,009	0,002	0,190	0,995	0,005	0,006
7	0,2	0	1	0	0	0,203	-0,008	1,037	0,001	-0,039	0,190	0,008	0,999	0,004	0,002
8	0	0	0	0	1,6	0,004	0,014	-0,035	0,024	1,613	0,003	0,000	0,004	0,001	1,593
9	1,2	0,1	0,1	0,5	0,1	1,189	0,130	0,088	0,492	0,109	1,202	0,103	0,108	0,502	0,098
10	1	0,2	0,1	0,5	0,1	0,972	0,184	0,000	0,518	0,058	1,001	0,192	0,100	0,503	0,108
11	0,6	0,6	0	0	0	0,588	0,586	0,084	-0,042	-0,020	0,589	0,609	0,007	0,004	0,003
12	0,3	0,2	0,2	1,5	0,4	0,289	0,246	0,220	1,517	0,404	0,301	0,232	0,205	1,504	0,397
13	0,2	0,2	0,3	1,5	0,4	0,279	0,194	0,258	1,535	0,424	0,187	0,184	0,312	1,495	0,389
14	0,4	0,4	0	0	1	0,372	0,416	0,039	-0,004	1,021	0,402	0,403	0,008	0,003	1,004
15	0,6	0,4	0	2	0	0,586	0,409	0,037	2,009	-0,026	0,620	0,403	0,006	2,028	0,001
16	0	0,8	0	0	0,8	0,011	0,778	0,008	0,004	0,847	0,003	0,807	0,000	0,001	0,794
17	0,2	0,2	0,2	1	0,2	0,262	0,187	0,157	0,983	0,213	0,189	0,192	0,194	0,991	0,188
18	0,3	0,1	0,2	1	0,4	0,205	0,120	0,267	0,976	0,411	0,283	0,147	0,212	0,990	0,392
19	0,2	0,3	0,1	1	0,4	0,184	0,315	0,100	0,958	0,416	0,200	0,319	0,094	1,002	0,394
20	0,2	0,2	0,3	0,5	0,4	0,178	0,162	0,359	0,499	0,398	0,167	0,171	0,306	0,519	0,416

Bảng 11: Nồng độ của các ion kim loại thu được từ mô hình PCR-ANN và sai số tương đối thu được.

Mẫu	Nồng độ dung dịch kiểm tra (mg/l)					Nồng độ dung dịch thu được từ mô hình (mg/l)					Sai số tương đối (%)
	Cu	Ni	Co	Pb	Cd	Cu	Ni	Co	Pb	Cd	Cu	Ni	Co	Pb	Cd
1	0,4	0	0,4	3	0,4	0,386	0,001	0,415	3,006	0,389	3,48	0	3,790	0,228	2,567
2	0,4	0,6	0	1	0,4	0,408	0,604	0,002	1,010	0,393	2,14	0,809	0	1,034	1,736
3	0,6	0,2	0,2	0	0,4	0,606	0,190	0,200	0,001	0,395	1,06	4,547	0,442	0	1,606
4	0,4	0,2	0,4	3	0	0,400	0,216	0,401	3,000	0,007	0,11	8,089	0,345	0,009	0
5	0	0,4	0	0	1,2	0,007	0,400	0,009	0,007	1,189	0	0,177	0	0	0,874
6	0	0,2	1	0	0	0,002	0,190	0,995	0,005	0,006	0	4,907	0,484	0	0
7	0,2	0	1	0	0	0,190	0,008	0,999	0,004	0,002	4,590	0	0,010	0	0
8	0	0	0	0	1,6	0,003	0,000	0,004	0,001	1,593	0	0	0	0	0,387
9	1,2	0,1	0,1	0,5	0,1	1,202	0,103	0,108	0,502	0,098	0,233	3,347	8,263	0,593	1,910
10	1	0,2	0,1	0,5	0,1	1,001	0,192	0,100	0,503	0,108	0,163	3,989	0,058	0,753	8,232
11	0,6	0,6	0	0	0	0,589	0,609	0,007	0,004	0,003	1,748	1,631	0	0	0
12	0,3	0,2	0,2	1,5	0,4	0,301	0,232	0,205	1,504	0,397	0,445	16,19	2,850	0,305	0,640
13	0,2	0,2	0,3	1,5	0,4	0,187	0,184	0,312	1,495	0,389	6,061	7,594	4,036	0,313	2,699
14	0,4	0,4	0	0	1	0,402	0,403	0,008	0,003	1,004	0,572	0,755	0	0	0,406
15	0,6	0,4	0	2	0	0,620	0,403	0,006	2,028	0,001	3,482	0,883	0	1,432	0
16	0	0,8	0	0	0,8	0,003	0,807	0,000	0,001	0,794	0	0,882	0	0	0,689
17	0,2	0,2	0,2	1	0,2	0,189	0,192	0,194	0,991	0,188	5,462	3,504	2,675	0,876	5,921
18	0,3	0,1	0,2	1	0,4	0,283	0,147	0,212	0,990	0,392	5,391	47,99	6,045	0,924	1,960
19	0,2	0,3	0,1	1	0,4	0,200	0,319	0,094	1,002	0,394	0,449	6,368	5,420	0,240	1,353
20	0,2	0,2	0,3	0,5	0,4	0,167	0,171	0,306	0,519	0,416	16,01	14,08	2,127	3,857	4,133

So sánh các giá trị nồng độ thu được từ bảng 10 cho thấy, phương pháp PCR-ANN cho phép tính toán nồng độ các cấu tử gần với giá trị thực của các dung dịch chuẩn hơn. Đồng thời bảng 11 cho thấy, nồng độ các cấu tử thu được từ mô hình PCR-ANN cho thấy, sai số tương đối đều rất nhỏ, phù hợp để xác định đồng thời nhiều cấu tử trong cùng 1 dung dịch và phương pháp PCR-ANN cho giá trị RSE(%) là rất thấp (0%). Có một số mẫu mà nồng độ của 1 trong 5 cấu tử bằng 0, thì kết quả nồng độ đó thu được từ mô hình cũng là rất nhỏ (khoảng 0,001ppm). Mẫu 18 có sai số rất lớn, điều này chỉ có thể giải thích là do bản thân mẫu đã mắc sai số hệ thống do pha chế.

Các phương pháp xác định đồng thời các cấu tử trong cùng dung dịch khác thường gặp phải khó khăn: đối tượng phân tích phải nằm trong khoảng tuyến tính, các mẫu phân tích không mắc sai số hệ thống, hoá chất tinh khiết… Nhưng khi phân tích đồng thời Cu²⁺, Co²⁺, Ni²⁺, Pb²⁺, Cd²⁺, chúng tôi đã tiến hành thí nghiệm với các mẫu chuẩn nằm ngoài khoảng tuyến tính, các kết quả phân tích mắc phải sai số hệ thống khi khảo sát sự phụ thuộc của độ hấp thụ quang vào nồng độ, đồng thời mẫu trắng có độ hấp thụ quang khá cao (cao nhất là 0,217) nhưng những nhược điểm đó đã được mạng nơron nhân tạo khắc phục. Do đó hàm lượng các kim loại thu được chính xác hơn. Sai số tương đối nhỏ nhất là 0% và lớn nhất là 47%. Tuy nhiên, các giá trị sai số của mẫu 18 đều rất lớn, chứng tỏ là mẫu kiểm tra số 18 đã mắc sai số thô trong quá trình pha mẫu.

Từ các kết quả trên cho thấy mạng nơron nhân tạo là một phương pháp tối ưu để giải quyết các bài toán xác định đồng thời các cấu tử trong cùng hỗn hợp ngay cả khi hỗn hợp các cấu tử có tín hiệu đo tuyến tính hay phi tuyến tính với nồng độ chất phân tích. Tuy nhiên, nếu chỉ sử dụng phương pháp mạng nơron nhân tạo, thì do kích thước tập số liệu khá lớn, khiến cho thời gian luyện mạng mất nhiều thời gian, có khi lên tới 60 phút. Vì vậy, chúng tôi sử dụng phương pháp phân tích thành phần chính để giảm kích thước tập số liệu, rút ngắn thời gian phân tích mà không làm mất lượng thông tin có trong tập dữ liệu ban đầu.

Vì thời gian có hạn nên chúng tôi chưa thử được mô hình mạng PCR-ANN để xác định hàm lượng Cu²⁺, Co²⁺, Ni²⁺, Pb²⁺, Cd²⁺ trong mẫu thực tế và so sánh với các phương pháp khác cũng như thử trên các đối tượng khác. Những nghiên cứu này sẽ được tiến hành trong thời gian tới.

3.3.3. Đánh giá tính hiệu quả của phương pháp PCR-ANN

Phương pháp PCR-ANN là phương pháp hồi quy đa biến cho phép phân tích đồng thời nhiều cấu tử, độ chính xác cao. Để đánh giá tính hiệu quả của mô hình, chúng tôi tiếp tục xây dựng mô hình PCR-ANN để xác định đồng thời 3 ion kim loại Ce²⁺, Cu²⁺ và Ca²⁺dựa trên kết quả phân tích của đề tài “ xác định đồng thời các kim loại Ce, Cu và Ca trong lớp phủ bảo vệ kim loại đen bằng phương pháp hấp thụ phân tử sử dụng mạng ANN” – luận văn thạc sĩ khoa học (2006) của tác giả [11]

Kích thước tập số liệu gồm 2 ma trận:

+ Ma trận độ hấp thụ quang A (342x 76) 342 mẫu của hỗn hợp 3 ion kim loại Ce²⁺, Cu²⁺ và Ca²⁺ tại 76 bước sóng (từ 580 nm đến 730 nm).

+ Ma trận nồng độ C (342 x 3) (342 mẫu và 3 ion kim loại)

Phân tích thành phần chính:

+ Chuẩn hóa tập số liệu đầu vào: stdr = std(Ao) ;

+ Chuyển tập số liệu sang 1 tọa độ mới: sr = Ao./repmat(stdr,342,1); 342 là số mẫu tiến hành đo độ hấp thụ quang.

+ Tính toán các giá trị tải trọng (loading) và trị số (score), phương sai (var)

Каталог: jspui -> bitstream -> 123456789
123456789 -> Nguyễn Ngọc Lý Giám đốc Trung tâm Nghiên cứu về Môi trường và Cộng đồng
123456789 -> Khoa Báo chí Đhkhxh&NV
123456789 -> Acknowledgements
123456789 -> Danh mục chữ viết tắT
123456789 -> Chương TỔng quan vật liệu mao quản trung bình (mqtb) trật tự 1 Giới thiệu chung
123456789 -> Khoa hóa họC (141 142 báo cáo)
123456789 -> TRƯỜng đẠi học khoa học tự nhiên lưƠng thị loan

tải về 1.12 Mb.

Chia sẻ với bạn bè của bạn:

1 2 3 4 5 6