Vò Quúnh Thu Cao häc K18



tải về 1.12 Mb.
trang2/6
Chuyển đổi dữ liệu07.07.2016
Kích1.12 Mb.
1   2   3   4   5   6

f (u) =

0 nếu u < 0

b. Hàm piecewwise – linear

1 nếu u > 1/2

f (u) = u nếu 1/2 > u > -1/2

0 nếu u < -1/2

c. Hàm sigmoid (logistic)

f (u) = 1

1 + exp (-au)

d. Hàm tang- hyperbol

f (u) = tanh (u) = eu – e-u

eu + e-u



Hình 3: Đồ thị các hàm thường dùng

Với mỗi mô hình tính toán, ta phải xác định các thuật toán học để tự động xác định các giá trị tham số tối ưu cho mô hình trên cơ sở bộ số liệu cho trước (các con số này người xây dựng chương trình không phải quan tâm) .



* Hằng số tốc độ học

Hằng số tốc độ học là một yếu tố quan trọng ảnh hưởng đến hiệu quả và độ hội tụ của thuật giải lan truyền ngược sai số. Không có hằng số tốc độ phù hợp cho tất cả các bài toán khác nhau. Hằng số tốc độ học thường được chọn bằng thực nghiệm cho mỗi bài toán ứng dụng cụ thể. Nếu giá trị của hằng số tốc độ học quá nhỏ, tốc độ hội tụ của giải thuật sẽ rất chậm và không có lợi vì thủ tục học sẽ kết thúc tại một cực tiểu cục bộ địa phương gần nhất.

1.2.2.1.4. Các mô hình mạng nơron nhân tạo.

Liên kết các đầu vào và ra của nhiều nơron với nhau ta được một mạng nơron. Việc ghép nối các nơron trong mạng với nhau có thể theo một nguyên tắc bất kì nào đó. Từ đó có thể phân biệt các nơron khác nhau như các loại nơron mà các đầu vào nhận thông tin từ môi trường bên ngoài với các loại nơron mà các đầu vào được nối với các nơron khác trong mạng. Các nơron mà đầu vào giữ chức năng nhân thông tin từ môi trường bên ngoài gọi là “đầu vào” của mạng. Cũng tương tự như vậy, một nơron có một đầu ra, đầu ra của nơron này cũng có thể là đầu vào của nhiều nơron khác hoặc có thể đưa ra từ môi trường bên ngoài. Những nơron có đầu ra đưa tín hiệu vào môi trường bên ngoài được gọi là đầu ra của mạng. Một mạng nơron bao gồm nhiều lớp, mỗi lớp bao gồm nhiều nơron có cùng một chức năng trong mạng.

- Mạng nơron truyền thẳng một lớp (perceptron).

Đ
neuron


neuron

neuron

neuron

ây là cấu trúc mạng nơron đơn giản nhất. Mạng nơron này chỉ gồm 1 lớp xuất, không có lớp ẩn.

input output



+ Mô hình toán học của perceptron:

output =f(∑viwj)

f được gọi là hàm kích hoạt (activation action) hay hàm truyền có thể là hàm tuyến tính, hàm ngưỡng (Heaviside step), logistic sigmoid.

+ Khả năng của perceptron:

- Phương trình v.w=0 chính là một siêu phẳng trong không gian d-chiều. Do đó perceptron có khả năng phân lớp tuyến tính nên có thể dùng để giải bài toán hồi quy tuyến tính.

- Hạn chế của perceptron: không thể phân lớp phi tuyến

- Mạng lan truyền nhiều lớp (multi layer perceptron-MLP)

* Cấu trúc mạng MLP 1 lớp ẩn :



Mạng này có 3 lớp: lớp đầu vào gồm các tín hiệu đầu vào; lớp ẩn ở giữa chứa các nơron ẩn; một lớp đầu ra gồm tín hiệu đầu ra. Một mạng như vậy được xác định bởi 3 thông số tương ứng với 3 lớp là N, M, K. Trong đó, N là số đầu vào, M là số nơron lớp ẩn, K là số đầu ra (bằng số nơron lớp đầu ra).

- Mạng lan truyền ngược (RBF)

Mạng lan truyền ngược hay còn gọi là mạng phản hồi là mạng mà đầu ra của một nơron có thể là đầu vào của nơron trên cùng một lớp hoặc của lớp trước đó. Mạng RBF thưòng sử dụng hàm Kernel là hàm gaussian để tính vì sự không tuyến tính. Hàm Gaussian được đặc trưng bởi hai thông số giá trị trung tâm(C) và độ rộng

* Mô hình của mạng RBF :



Hình 4 :Mô hình mạng RBF

Trong đó hàm f được lựa chọn là hàm dạng như sau :





Hình 5 : Dạng đồ thị hàm f của mạng RBF .

1.2.2.1.5. Giải thuật lan truyền ngược

Thuật toán này được tạo ra bằng cách tổng quát hoá qui luật phổ biến Widrow-Hoff với mạng đa lớp và hàm chuyển vi phân không tuyến tính, vectơ nhập và vectơ mục tiêu tương ứng được dùng để tạo mạng cho đến khi nó có thể xấp xỉ hoá một hàm liên quan tới vectơ nhập và vectơ xuất.

Nếu có n biến đầu vào ta sẽ có tín hiệu vào đồng thời ở các nút nhập và được lan truyền thẳng qua các nơron rồi xuất hiện tại điểm ra cuối cùng của mạng như tín hiệu ra. Tổng tín hiệu vào tại một nơron được tính là hàm của các tín hiệu vào và liên quan đến synaptic weight để ứng dụng cho một nơron nào đó. Nơron này sẽ chuyển tổng tín hiệu nhập thành tín hiệu ra (outgoing) sử dụng hàm chuyển đổi (transfering function) và phát đi đến các nơron khác. Trong khi đó một tín hiệu sai số xuất phát tại một nơron ra của mạng và truyền ngược lại theo từng lớp đến các nút mạng phía trước. Mỗi quá trình truyền đi của tín hiệu và truyền ngược lại của sai số được gọi là một bước lặp (epoch). Tín hiệu sai số và gradient sai số tại mỗi nơron được tính cho một trọng số đã chọn (weight optimizato) sao cho sai số đầu ra là nhỏ nhất.



n

E = ∑ (t (xi, w) – y (xi))2

i = 1

Trong đó:



t (xi, w): giá trị của tập mẫu

y (xi): giá trị đầu ra của mạng

Trước tiên , ta xét trên 1 nơron, mỗi nơron đều có giá trị vào và ra, mỗi giá trị đều có một trọng số để đánh giá mức độ ảnh hưởng của giá trị vào đó. Thuật toán Back – Propagation sẽ điều chỉnh các trọng số đó để giá trị ej = Tj – yj là nhỏ nhất.

Trước hết ta phải xác định vị trí của mỗi nơron. Nơron nào là của lớp ẩn và nơron nào là của lớp xuất. Ta cần biết các ký hiệu:

wij: vector trọng số của nơron j số đầu vào i

uj: vector giá trị đầu ra của nơron trong lớp j

x1 tj



Wij

x2

W2j ej



xi – 1 W(i – 1)j

sum

x3 Wij Nơron j



Hình 6: Mô hình tính toán một nơron

  • Giá trị sai số của nơron j tại vòng lặp thứ n

ej (n) = tj (n) – yj (n)

  • Tổng bình phương sai số của mạng nơron:

k

E (n) = 1 ∑ e2j (n)

2 j =1

  • Tại nơron j ta có tổng trọng số input:

p

uj (n) = ∑ wij.xj (n)

i= 0

  • Giá trị đầu ra của nơron j:

yj (n) = fj (uj(n))

- Tính toán giá trị đạo hàm sai số cho mỗi nơron wij

Giá trị điều chỉnh trọng số:

Như vậy quá trình điều chỉnh trọng số có thể được xác định theo các công thức trên, tuy nhiên ta cần phải xác định vị trí của nơron thuộc lớp nào (lớp ẩn hay lớp xuất). Điều này rất quan trọng trong việc tính toán cho từng hệ số điều chỉnh trọng số.

Như vậy tuỳ theo hàm hoạt động ta có thể tính dễ dàng tính toán các giá trị điều chỉnh trọng số cho từng trọng số tương ứng theo thuật toán lan truyền ngược Back – Propagation.

1.2.2.1.6. Ưu, nhược điểm của mạng nơron nhân tạo

* Ưu điểm

- Phương pháp cho phép xác định đồng thời nhiều cấu tử khi phổ của chúng trùng lấn nhau ngay cả khi các đại lượng vật lý đo được không có tính cộng tính. Trong khi đó các phương pháp khác như trắc quang đạo hàm, Vierordt đòi hỏi các đại lượng đó phải có tính cộng tính.

- Mạng ANN cho phép xác định đồng thời nhiều cấu tử mà trong hệ có nhiều quá trình xảy ra còn chưa biết hay còn gọi là hệ mờ, nhờ vậy mà ANN có thể xác định bằng phương pháp trắc quang ngay cả khi trong dung dịch có sự tạo phức cạnh tranh, thuốc thử tạo phức màu không đủ dư và khi nồng độ các cấu tử cần xác định không nằm trong khoảng tuyến tính.

- ANN cho phép xác định đồng thời nhiều cấu tử mà phổ của chúng trùng lấn nhau bằng các kỹ thuật khác nhau như: điện hoá, trắc quang động học, huỳnh quang tia X...

* Nhược điểm

- Thời gian luyện mạng thường khá lâu.

- Chưa có phần mềm tiện ích để sử dụng ngay, đòi hỏi người thực hiện phải nắm rõ thuật toán để viết chương trình trên các phần mềm khác (Pascal, Matlab, C+, ... ) mới sử dụng được.

- ANN có rất nhiều thuật toán khác nhau, do đó khi xây dựng một mô hình phân tích chất, đòi hỏi người sử dụng phải thử nhiều mô hình để tìm được cấu trúc mạng tối ưu.

1.2.2.1.7. Ứng dụng của mạng nơron nhân tạo

Đặc trưng của ANN là khả năng học và xử lý song song. Nó cho phép học được dáng điệu và lưu lại mối quan hệ giữa các yếu tố đầu vào và đầu ra của các quá trình cần nghiên cứu dựa trên việc học một tập dữ liệu đủ lớn mô tả quá trình đó. Sau khi học xong, ANN có thể tính toán kết quả đầu ra tương ứng với bộ số liệu đầu vào mới.

ANN có rất nhiều ứng dụng trong nhiều ngành và lĩnh vực khác nhau:

- Giải các bài toán phân lớp: bài toán này đòi hỏi giải quyết vấn đề phân loại các đối tượng thành các nhóm dựa trên những đặc điểm của các nhóm đối tượng. Trên cơ sở này người ta sử dụng ANN trong nhận dạng chữ viết, tiếng nói, phân loại gen, phân loại chất lượng sản phẩm...[23]

- Bài toán dự báo: mạng ANN đã được ứng dụng trong việc xây dựng mô hình dự báo sử dụng tập dữ liệu trong quá khứ để dự đoán số liệu cho tương lai (dự báo thời tiết).

- Bài toán điều khiển và tối ưu hoá: ANN được sử dụng trong hệ điều khiển tự động cũng như trong việc giải quyết rất nhiều bài toán tối ưu trong thực tế.[21]

Nhìn chung, ANN là công cụ cho phép tiếp cận có hiệu quả để giải quyết các bài toán có tính phi tuyến tính, biến động, dữ liệu có nhiễu và đặc biệt là trong trường hợp các mối quan hệ mà bản chất vật lý của các quá trình cần nghiên cứu không dễ dàng nhận biết và thể hiện chúng hay còn gọi là các tập mờ.[9]

* Ứng dụng trong hoá học phân tích [32]



Việc nghiên cứu xác định đồng thời nhiều cấu tử mà phổ của các đại lượng vật lý đo được của chúng xen phủ nhau đã được nhiều tác giả quan tâm nghiên cứu. Để xác định đồng thời nhiều cấu tử có nhiều phương pháp: phương pháp trắc quang đạo hàm, phương pháp chuẩn đa biến sử dụng bình phương tối thiểu (CLS, ILS, PLS)....nhưng phương pháp đạo hàm sẽ làm giảm độ nhạy của phép phân tích còn trong nhiều trường hợp các phương pháp bình phương tối thiểu không thích hợp vì tín hiệu đo không có tính cộng tính .

Hiện nay nhiều công trình nghiên cứu sử dụng ANN được triển khai thực hiện ở rất nhiều phòng thí nghiêm trên thế giới. ANN cho phép mô hình hoá các mối quan hệ phi tính phức tạp. Nó cho phép giải quyết mối quan hệ mà trong đó có những quá trình xảy ra chưa được biết hoặc những thông tin về hệ còn chưa đầy đủ hay hệ mờ.

- Bằng ANN người ta đã nghiên cứu xác định các axit hiđroxylat benzoic và axit cianmic bằng phương pháp chuẩn độ điện thế cho kết quả chính xác với sai số 4,18% [40].

- Phương pháp điện hoá sử dụng mạng ANN đã được nghiên cứu xác định đồng thời Ag(I), Hg(II), Cu(II) bằng đo thế sử dụng điện cực cacbon nhão không biến tính. Xác định Mo, Cu bằng phổ xung vi phân hoà tan hấp phụ catot, etanol, fructoza và glucoza bằng phương pháp volampe xung bậc thang (DPSV)…

- ANN được sử dụng trong nghiên cứu xác định đồng thời anilin và cyclohexylamin cho kết quả có độ lệch chuẩn tương đối (RMSD) từ 0,9-1,17 [32]

- Bằng phương pháp trắc quang sử dụng mạng ANN đã xác định đồng thời phenobarbiton và phenytoinnatri trong các mẫu thuốc và dược phẩm. xác định đồng thời Zn(II), Cd(II), Hg(II) trong nước với độ lêch chuẩn 0,29-Cd, 0,38 và 0,35 với Hg và Zn(II). [35]

Bên cạnh đó, nhóm tác giả [39] đã nghiên cứu mạng nơron nhân tạo gồm 3 lớp với thuật toán lan truyền ngược để thiết lập mối quan hệ phi tuyến giữa nồng độ của anthranilic acid (HA), nicotinic acid (HN), picolinic acid (HP) and sulfanilic acid (HS) trong hỗn hợp và pH của các dung dịch ở các thể tích khác nhau của dung dịch thêm vào khi chuẩn độ. Các cấu tử chính của ma trận pH được sử dụng làm đầu vào trong ANN. Mô hình mạng tối ưu đã xác định được nồng độ của axit trong các mẫu tự tạo. Kết quả chỉ ra rằng, ANN phân tích dữ liệu chuẩn độ với sai số tương đối thấp (< 4%).

Bằng phương pháp trắc quang động học sử dụng mạng ANN đã nghiên cứu xác định glucoza, fructoza, lactoza với kaliferi xianua (K3Fe(CN)6. Xác định đồng thời Co(II), V(IV) trên cơ sở tốc độ phản ứng của chúng với Fe(II) khi có mặt thuốc thử 1,10-phenanthrolin. [39]

Ở Việt Nam, đã có một số công trình xác định đồng thời các chất bằng mạng nơron nhân tạo nhờ phần mềm WinNN (mua của Mỹ) như: xác định đồng thời Uran và Thori[2], xác định đồng thời Ni(II), Cu(II), Zn(II) bằng phương pháp chuẩn đa biến sử dụng mạng nơron nhân tạo bằng phần mềm WinNN với sai số lớn nhất của Ni(II) là 8%, Cu(II) là 5% và Zn(II) là 10,2%; phương pháp xác định được nồng độ các mẫu cả trong và ngoài khoảng tuyến tính.[22]

Tuy nhiên, chưa có công trình nghiên cứu nào tiến hành phân tích đồng thời các chất sử dụng phương pháp mạng nơron nhân tạo và phân tích thành phần chính kết hợp với mạng nơron nhân tạo viết trên phần mềm MATLAB.

1.2.2.2. Phương pháp phân tích thành phần chính (PCA).[24,15]

* Khái niệm

Phân tích thành phần (cấu tử) chính là công cụ hữu hiệu cho phép giảm số biến trong tập số liệu từ tập số liệu đa chiều bằng cách tìm ra giá trị phương sai lớn nhất với số cấu tử chính (PC) hay các biến ảo ít nhất.

PCA là thuật toán đa biến dựa trên việc quay các trục số liệu chứa các biến tối ưu. Khi đó, một tập hợp các biến liên quan với nhau được chuyển thành tập hợp các biến không liên quan và được sắp xếp theo thứ tự giảm độ biến thiên hay phương sai. Những biến không liên quan này là sự kết hợp tuyến tính các biến ban đầu. Dựa trên phương sai do mỗi biến mới gây ra có thể loại bỏ bớt các biến phía cuối dãy mà chỉ mất ít nhất thông tin về các số liệu thực ban đầu. Bằng cách này sẽ giảm được kích thước của tập số liệu trong khi vẫn có thể giữ nguyên thông tin.

*Thuật toán PCA.

Phương pháp này sẽ thiết lập 1 tập biến mới, được gọi là các cấu tử chính. Mỗi cấu tử chính là 1 sự kết hợp tuyến tính của các biến chung. Tất cả các cấu tử chính đều trực giao với nhau và không làm giảm đi lượng thông tin có trong tập dữ liệu. Các cấu tử chính đó coi như 1 dạng trực giao cơ sở của không gian dữ liệu.



- Cấu tử chính thứ nhất là 1 trục tọa độ trong không gian, sao cho chứa nhiều thông tin của các biến nhất.



Hình 7: Đồ thị biểu diễn sự dịch chuyển các biến sang trục đầu tiên

Khi chiếu mỗi biến cũ lên hệ tọa độ đó trước tiên sẽ hình thành 1 biến mới (PC1) hay trục thứ nhất, đó là giá trị riêng lớn nhất của các biến ảo (các PC). Cấu tử thứ 2 hay một 1 trục tọa độ khác trong không gian (PC2), vuông góc với cấu tử thứ nhất. Quá trình chiếu các biến lên trục tọa độ này sẽ tạo ra các giá trị mới.




Hình 8: Đồ thị biểu diễn sự dịch chuyển các biến sang trục thứ 2

- Nếu tập dữ liệu có k biến thì hệ tọa độ mới cũng có k chiều (k PC). Tập dữ liệu đầy đủ của các cấu tử này cũng chứa lượng thông tin giống như các giá trị của tập dữ liệu cũ, nhưng 80% thông tin tập trung vào các PC đầu tiên. Kích thước của tập dữ liệu được giảm bằng cách kiểm tra các yếu tố ảnh hưởng chính tới tập dữ liệu ban đầu. Thông thường, chỉ có 3, 4PC đầu là chứa nhiều thông tin ảnh hưởng đến kết quả của tập dữ liệu ban đầu.

Khi phân tích cấu tử chính (là quá trình chiếu các biến ban đầu lên 1 hệ trục tọa độ mới phù hợp), các giá trị mới thu được là:

PCALoading: là hệ số góc của hệ trục tọa độ cũ so với hệ trục tọa độ mới.

PCAScore: là các giá trị của dữ liệu ban đầu chiếu lên hệ trục tọa độ mới. Đây là các giá trị mang thông tin của tập dữ liệu, được sử dụng để làm dữ liệu đầu vào trong các phép phân tích tiếp theo.

PCAVar: là phương sai tích lũy của các biến mới so với các biến ban đầu. Dựa vào PCAVar để đánh giá lượng thông tin chứa trong mỗi PC.



PCALoading PCAScore PCAVar



Hình 9: Giá trị PCALoading, PCAScore, PCAVar thu được khi chiếu lên các trục

*Ứng dụng của PCA

- Giảm kích thước tập số liệu, từ biểu diễn n chiều trong không gian thành biểu diễn hai hoặc 3 chiều với số biến có ảnh hưởng chính đến tập số liệu.

- Loại bỏ sự đa cộng tính giữa các biến trong việc xây dựng phương trình hồi qui biểu diễn sự phụ thuộc của tín hiệu phân tích vào các biến là nồng độ các cấu tử trong hệ. Phương pháp này có tên gọi là hồi qui cấu tử chính.

- Từ tập số liệu với n biến ban đầu có liên quan mật thiết với nhau, sau khi giảm thành p biến không liên quan thì trị riêng của chúng có thể sử dụng làm số liệu đầu vào của phương pháp hồi qui kết hợp với mạng noron nhân tạo giải bài toán phân tích đồng thời các cấu tử trong hệ có tương tác không cộng tính.

Tuy nhiên PCA đơn thuần là phương pháp toán học nên các kết quả thu được bị ảnh hưởng rất lớn bởi tập số liệu ban đầu vì vậy cần kết hợp với những kiến thức chuyên ngành khác nếu không sẽ dẫn đến những giải nghĩa sai lệch.

1.2.2.3. Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính xác định đồng thời các chất.

Khi phân tích hồi quy đa biến bằng phương pháp mạng nơron nhân tạo, ma trận số liệu đầu vào càng lớn, tức là tập số liệu đầu vào chứa càng nhiều thông tin thì kết quả thu được ở đầu ra càng gần với giá trị thực. Tuy nhiên, khi số liệu quá lớn làm cho thời gian luyện mạng lớn hơn, có thể làm quá trình luyện mạng lặp lại nhiều lần và gây nên sai số lớn. Phương pháp phân tích cấu tử chính thường được sử dụng trước để giảm kích thước của tập số liệu mà không làm mất đi lượng thông tin chứa trong tập số liệu đó.

Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính thường gồm các bước như sau:

- Bước 1: Xác định tập dữ liệu cần phân tích. Đối với phương pháp trắc quang thì tập dữ liệu phân tích sẽ là ma trận độ hấp thụ quang (p dung dịch chuẩn x n bước sóng) và ma trận nồng độ mẫu phân tích (p mẫu phân tích, m cấu tử, ).

- Bước 2: Dùng phương pháp phân tích thành phần chính (PCA) để giảm kích thước tập dữ liệu ban đầu. Sau khi tính toán tổng phương sai tích lũy để chỉ ra số PC chính, thì giá trị PCAScore là tập dữ liệu ảo (k x n) trong đó k < m. được sử dụng để làm dữ liệu của lớp nhập.

- Bước 3: Sử dụng ma trân dữ liệu ảo (k x n) làm dữ liệu đầu vào của mô hình mạng nơron nhân tạo và ma trận nồng độ (m x p) làm dữ liệu đầu ra của mô hình mạng nơron nhân tạo.

* Ứng dụng PCR- ANN trong hóa phân tích

Nhóm tác giả [26 ] đã phân tích đồng thời thioxianat và sunfua bằng phương pháp phân tích động học trắc quang sử dụng dãy các trị riêng (eigenvalue) và sắp xếp các hệ số tương quan (correlation ranking) trong phân tích thành phần chính và mạng nơron nhân tạo. Phương pháp xác định ion thioxianat trong khoảng nồng độ 60 – 700 ng.ml-1 và ion sunfua trong khoảng nồng độ 20 -400 ng.ml-1 và dùng để phân tích các mẫu nước máy, nước ngầm và nước sông. Phương pháp phân tích thành phần chính với thuật toán SVD được sử dụng để giảm kích thước của tập số liệu, từ 301 giá trị ban đầu thuật toán giảm xuống chỉ còn 5 cấu tử (PC), đó cũng là số cấu tử của nút nhập trong mạng nơron nhân tạo. Hai phương pháp được lựa chọn để tìm số cấu tử thích hợp là sắp xếp các cấu tử theo eigenvalue hoặc theo sự tương quan. Các PC được thay đổi từ 1 -8 để dùng trong nút nhập của mạng ANN, cùng các thông số khác để thiết lập mô hình PC – WNN tối ưu. Mô hình CR-PC-WNN đạt sai số tương đối là 5,6% và EV-PC-WNN đạt sai số là 6,8%.

Tác giả [25] đã sử dụng phương pháp PC-ANN để phân tích đồng thời lượng vết Zr(IV) và Hf(IV) trong các mẫu nước sông và nước thải nhà máy. Mô hình được thiết lập bằng cách xây dựng ma trận nồng độ trong khoảng 0,03 – 3,4 µg.ml-1 Zr(IV), và 0,2 – 7,0 µg.ml-1 Hf(IV) với 23 mẫu học và 20 mẫu kiểm tra. Ma trận score và ma trận loading được tính toán bằng thuật toán SVD, đó là 1 trong các phương pháp phân tích thành phần chính.

Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính còn được sử dụng để xác định đồng thời 4 dạng phenol ( phenol, 2-Clo phenol, 3-Clo phenol và 4-Clo phenol) dựa trên sự oxi hóa với N,N-đietyl-p-phenyl điamin trong sự có mặt của Fe(CN)63+ trong khoảng nồng độ từ 0,1-7,0 μg/ml. Tác giả [36] đã sử dụng phương pháp phân tích thành phần chính để giảm kích thước tập dữ liệu động học trắc quang đo ở 680nm và sử dụng mạng nơron 3 lớp với giải thuật lan truyền ngược để luyện mạng. Mô hình PC-ANN tối ưu thu được cho phép phân tích định lượng 4 hợp chất trên với sai số tương đối nhỏ hơn 5%.

Phương pháp PC-ANN còn được áp dụng để phân tích đồng thời antipyriien và caffeine citrate trong thuốc [48] với 43 mẫu học, 20 mẫu luyện mạng và 10 mẫu kiểm tra. Phép phân tích được tiến hành trong vùng hồng ngoại gần với bước sóng 1100nm đến 2500nm. Các mẫu kiểm tra cho giá trị sai số tương đối chuẩn từ 1,489 đến 2,611%.

1.3. Phần mềm Matlab( Matrix in laboratory) [4]

Matlab là chương trình phần mềm hỗ trợ đắc lực cho tính toán với ma trận và hiển thị. Nó có thể chạy trên hầu hết các hệ máy tính, từ máy tính cá nhân đến các hệ super computer. Matlab được điều khiển bằng tập các lệnh, tác động qua bàn phím trên cửa sổ điều khiển. Nó cũng cung cấp khả năng lập trình với cú pháp dịch lệnh còn gọi là scrip file.

Các lệnh của Matlab rất hiệu quả, nó cho phép giải các loại bài toán khác nhau và đặc biệt hữu dụng cho các hệ phương trình tuyến tính hoặc tính toán với hàm toán học phức tạp.

Ngoài ra, Matlab còn có thể xử lý dữ liệu, biểu diễn đồ hoạ một cách linh hoạt, đơn giản và chính xác trong không gian 2 chiều cũng như 3 chiều, kể cả khả năng tạo hoạt cảnh, bởi những công cụ như các tệp lệnh ngày càng được mở rộng với 25 thư viện trợ giúp (Toolboxs) và bản thân các hàm ứng dụng được tạo lập bởi người sử dụng. Không cần nhiều đến kiến thức về máy tính cũng như các kĩ thuật lập trình phức tạp, mà chỉ cần đến những hiểu biết cơ bản về lý thuyết số, toán ứng dụng, phương pháp tính và khả năng lập trình thông dụng, người sử dụng có thể dùng Matlab như công cụ hữu hiệu cho lĩnh vực chuyên ngành của mình.

Đối với hoá học phân tích, việc ứng dụng tiện ích của hàm M- file giúp tính toán dễ dàng và thuận tiện, do chỉ cần nhập đúng hàm và Matlab sẽ cho ra kết quả của hàm.



* Các quy luật và thuộc tính của hàm M- file:

-Tên hàm và tên file phải là một ví dụ hàm flipud, file lưu là flipud.m

-Lần đầu tiên Matlab thực hiện hàm M- file nó sẽ mở file văn bản tương ứng và dịch lệnh của file đó ra một dạng mã lưu trong bộ nhớ nhằm mục đích tăng tốc độ thực hiện các lời gọi.

-Việc thi hành hàm M- file sẽ kết thúc khi gặp dòng cuối cùng của file đó hoặc gặp dòng lệnh return. Lệnh return giúp ta kết thúc một hàm mà không cần phải thi hành hết các lệnh của hàm đó.

-Hàm Error của Matlab sẽ hiển thị một chuỗi lên cửa sổ lệnh và dừng thực hiện hàm, trả điều khiển về cho cửa sổ lệnh và bàn phím.

-Một M- file có thể chứa nhiều hàm. Hàm chính trong M- file này phải đặt trùng với tên của M- file như đề cập đến ở trên. Các hàm khác được khai báo thông qua câu lệnh function được viết sau hàm đầu tiên.

-Các dòng ghi lời chú thích cho tới dòng đầu tiên không phải là chú thích trong hàm M- file là những dòng văn bản nó sẽ hiện ra khi sử dụng lệnh help.

-Mỗi hàm có một không gian làm việc riêng tách biệt so với môi trường MATLAB, mối quan hệ giữa biến và hàm với môi trường MATLAB là các biến vào và ra của hàm đó. Nếu trong thân hàm giá trị bị thay đổi thì sự thay đổi này chỉ tác động bên trong của hàm đó mà không làm ảnh hưởng đến các biến của môi trường MATLAB. Các biến được tạo ra bên trong hàm thì chỉ nằm trong không gian làm việc của hàm đó và được giải phóng khi hàm kết thúc. Vì vậy, không thể sử dụng thông tin của lần trước gọi cho lần sau.

- Số các tham số vào và ra khi một hàm được gọi thì chỉ có tác dụng bên trong hàm đó, biến nargin chứa tham số đa vào, biến narout chứa các tham số đưa ra. Thường dùng biến narin hơn biến narout.

-Các hàm có thể dùng chung các biến với các hàm khác với môi trường Matlab là có thể đệ quy nếu như các biến được khai báo là toàn cục.



Đặc biệt, phần mềm này có cả một Toolbox với các hàm toán học dành riêng để thiết lập các mô hình mạng nơron nhân tạo, người sử dụng có thể tạo ra vô số các mô hình sao cho phù hợp với mục đích sử dụng.

Với những ưu điểm nổi trội như vậy, Matlab có thể giải quyết mọi vấn đề tính toán phức tạp trong hoá phân tích.

Chương II: THỰC NGHIỆM
2.1. Nội dung và phương pháp nghiên cứu.

2.1.1. Phương pháp nghiên cứu.

Cơ sở của phương pháp là dựa các phản ứng tạo phức màu của Ni(II), Co(II), Cu(II), Pb(II) và Cd(II) với thuốc thử PAR ở pH= 10, đo độ hấp thụ quang của các phức màu trên dải bước sóng 450-600 nm để xác định đồng thời 5 kim loại trên trong cùng một hỗn hợp bằng phương pháp mạng nơron nhân tạo kết hợp phương pháp phân tích thành phần chính để giảm kích thước tập số liệu.

PAR có công thức hóa học như sau:



PAR là thuốc thử có khả năng tạo phức đa dạng với hầu hết các ion kim loại chuyển tiếp, vì vậy có thể sử dụng để phân tích đồng thời các ion kim loại bằng phương pháp mạng nơron nhân tạo mà không cần phải tách loại các ion có trong hỗn hợp. Tuy nhiên, khi số cấu tử cần phân tích là lớn thì lượng mẫu phân tích cũng phải đủ lớn để xây dựng được mô hình ANN tối ưu thích hợp làm cho kích thước của tập dữ liệu là rất lớn. Do đó, chúng tôi đã nghiên cứu phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính để giảm kích thước tập số liệu mà vẫn cho được kết quả phân tích chính xác.

Các ion kim loại Co(II), Ni(II), Cu(II), Pb(II), Cd(II) tạo phức với PAR trong môi trường kiềm cho phổ hấp thụ xen phủ nhau gần như hoàn toàn với nên để xác định đồng thời các chất phải dùng phương pháp hồi quy đa biến. Tuy nhiên, bản thân thuốc thử PAR có màu nên ảnh hưởng rất lớn đến phép xác định do lượng thuốc thử dư, khi đó các phương pháp đa biến như bình phương tối thiểu thông thường (CLS), nghịch đảo (ILS) không tính đến độ hấp thụ quang của mẫu trắng sẽ cho sai số lớn. Vì vậy, phương pháp hồi quy đa biến phi tuyến, độ hấp thụ quang của các cấu tử khảo sát có phục được nhược điểm này.

Khi kích thước mẫu lớn thì phương pháp phân tích thành phần chính kết hợp với mạng nơron nhân tạo để tính toán cho phép tăng độ chính xác khi xác định đồng thời các kim loại.

Phương pháp PCR- ANN dựa trên việc xây dựng ma trận nồng độ dung dịch chuẩn và ma trận độ hấp thụ quang của các dung dịch phức màu của hỗn hợp các ion kim loại với thuốc thử PAR được dùng để thiết lập một mô hình toán học thông qua việc áp dụng PCA để tìm trị riêng và cấu tử chính làm đầu vào của mô hình ANN. Đầu ra của mô hình là nồng độ của các cấu tử trong dung dịch cần phân tích

Để đánh giá mô hình cần xây dựng một ma trận nồng độ và độ hấp thụ quang của các mẫu kiểm tra, thông qua việc tính toán sai số tương đối và tổng bình phương sai số để đánh giá độ chính xác của phương pháp từ đó áp dụng phân tích mẫu thựu tế.

2.1.2. Nội dung nghiên cứu.

Để xây dựng qui trình phân tích xác định đồng thời Cd2+, Co2+, Cu2+, Ni2+ , Pb2+ bằng phương pháp trắc quang sử dụng mạng nơron nhân tạo kết hợp với phân tích thành phần chính (PCR-ANN), trong luận văn này chúng tôi tập trung nghiên cứu các vấn đề sau:

- Nghiên cứu các điều kiện tối ưu của phản ứng tạo phức màu giữa các ion Cd2+, Co2+, Cu2+, Ni2+ , Pb2+ với thuốc thử PAR (pH, độ bền phức mầu, lượng thuốc thử dư…)

- Khảo sát khoảng tuyến tính xác định nồng độ của từng cấu tử trên với thuốc thử PAR từ đó xây dựng ma trận nồng độ có mặt 5 cấu tử.

- Nghiên cứu các phương pháp mạng nơron nhân tạo kết hợp phân tích thành phần chính để xác định nồng độ của các chất phân tích dựa vào phổ hấp thụ của hỗn hợp thu được. Cụ thể là:

+ Dùng phương pháp phân tích thành phần chính (PCA) tính toán tổng phương sai tích lũy, tìm ra số cấu tử chính phù hợp, giảm kích thước tập số liệu. Chuyển tập số liệu ban đầu thành tập số liệu mới có kích thước nhỏ hơn. Dùng tập số liệu mới này để làm dữ liệu đầu vào của mạng nơron nhân tạo

+ Thiết lập và khảo sát mô hình ANN tối ưu để tính toán, xác định nồng độ các cấu tử dựa vào phổ hấp thụ của hỗn hợp

- Đánh giá độ chính xác của mô hình, so sánh với phương pháp tính của mô hình khác.

2.2. Hóa chất, dụng cụ, thí nghiệm.

2.2.1. Hóa chất.

Các loại hoá chất được sử dụng là loại tinh khiết phân tích (P.A) và các dung dịch được pha chế bằng nước cất 2 lần.

- Dung dịch Co2+ 1000ppm: Hoà tan 1,2570 g CoCl2.6H2O (PA) bằng 50 ml dung dịch HCl 10% trong bình định mức 250, sau đó thêm nước cất đến vạch định mức thu được dung dịch Co2+ .

- Dung dịch chuẩn gốc Ni2+ 1000 ppm: Cân 1,0130 g NiCl2. 6H2O cho vào bình định mức 250 ml, thêm 50 ml dung dịch HCl 10%, lắc đều, thêm nước cất lắc cho tan hết, sau đó thêm nước cất đến vạch định mức.

- Dung dịch Cu2+ 1000ppm: Cân 0,9765 g CuSO4.5H2O, hòa tan trong nước cất 2 lần, chuyển vào bình định mức cỡ 250ml, lắc cho tan hết, định mức bằng nước cất đến vạch

- Dung dịch chuẩn gốc Cd2+ 1000ppm: Hoà tan 0,4079 g CdCl2 (P.A) trong 2 ml HCl đặc sau đó thêm nước cất đến vạch định mức 250ml thu được dung dịch Cd2+ 1000 ppm.

- Dung dịch chuẩn gốc Pb2+ 1000ppm: Hoà tan 0,3357g PbCl2 (P.A) trong 2 ml HCl đặc sau đó thêm nước cất đến vạch định mức 250ml thu được dung dịch Pb2+ 1000 ppm.

Nồng độ của dung dịch Ni2+ và Co2+ được xác định lại bằng phương pháp chuẩn độ phức chất như sau: Lấy 10,0 ml dung dịch Ni2+ hoặc Co2+ vào bình nón 250 ml, thêm chỉ thị murexit. Sau đó thêm dung dịch NH3 1M để điều chỉnh pH = 8 (thêm vài giọt dung dịch NH3 vào đến khi dung dịch có màu vàng nhạt thoáng đục). Chuẩn độ dung dịch thu được bằng dung dịch EDTA thì thấy dung dịch chuyển sang màu tím bền thì dừng lại. Sau đó từ dung dịch đã biết nồng độ chuẩn chúng tôi tiến hành pha loãng thành các dung dịch có nồng độ thấp hơn.

Nồng độ của dung dịch Cu2+ được kiểm tra lại bằng phương pháp chuẩn độ phức chất như sau: Lấy 10,0ml dung dịch Cu2+ vào bình nón 250ml, thêm dung dịch đệm axetat pH=5 và 3 giọt chỉ thị PAN. Đun sôi và chuẩn độ bằng đung dịch EDTA. Ở điểm tương đương dung dịch chuyển từ màu tím đậm sang màu vàng lục.

- Dung dịch đệm borac pH = 10: Trộn 3,092g H3BO3 và 3,728g KCl sau đó chuyển vào bình định mức 1 lít, thêm nước cất và lắc đều , cuối cùng định mức đến vạch bằng nước cất. Điều chỉnh lại pH bằng máy đo pH.

- Dung dịch thuốc thử PAR (C11H8N3O2Na.H2O , M = 255) 7,5x10-4M : cân 0,0404g PAR pha trong bình 250ml. Bảo quản thuốc thử trong ngăn mát tủ lạnh và sử dụng trong vòng 1 tuần.

2.2.2 Dụng cụ và thiết bị




1   2   3   4   5   6


Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2019
được sử dụng cho việc quản lý

    Quê hương