Anderson-Darling statistic
Measures how well the data follow a particular distribution. The better the distribution fits the data, the smaller this statistic will be. Use the Anderson-Darling statistic to compare the fit of several distributions to see which one is best or to test whether a sample of data comes from a population with a specified distribution. For example, you can use the Anderson-Darling statistic to choose between the Weibull and lognormal distributions for a reliability data analysis or to test whether data meets the assumption of normality for a t-test.
The hypotheses for the Anderson-Darling test are:
H0: The data follow a specified distribution
H1: The data do not follow a specified distribution
If the p-value (when available) for the Anderson-Darling test is lower than the chosen significance level (usually 0.05 or 0.10), conclude that the data do not follow the specified distribution. Minitab does not always display a p-value for the Anderson-Darling test because it does not mathematically exist for certain cases.
If you are trying to determine which distribution the data follow and you have multiple Anderson-Darling statistics, it is generally correct to compare them. The distribution with the smallest Anderson-Darling statistic has the closest fit to the data. If distributions have similar Anderson-Darling statistics, choose one based on practical knowledge.
Some commands generate an adjusted Anderson-Darling, or AD*, statistic. The non-adjusted Anderson-Darling statistic uses the nonparametric step function based on the Kaplan-Meier method of calculating plot points, while the adjusted Anderson-Darling statistic uses other methods to calculate the plot points.
Example of preprocessing responses for analyze variability
Giả sử chúng ta nghiên cứu các điều kiện tiến hành (yếu tố) ảnh hưởng đến kết quả của 1 phản ứng hóa học : thời gian , nhiệt độ và chất xúc tác. Một thí nghiệm nhân tố đầy đủ 2 mức độ với 8 lập lại (replicates) được tiến hành như vậy có thể phân tích sự biến thiên trong đáp ứng ở các mức yếu tố khác nhau.
Để phân tích sự biến thiên trong đáp ứng , trước hết phải tiến hành các đáp ứng lập lại để tính và lưu lại các độ lệch chuẩn và số lập lại.
1 Open the worksheet YIELDSTDEV.MTW. (The design and response data have been saved for you.)
2 Choose Stat > DOE > Factorial > Preprocess Responses for Analyze Variability.
3 Under Standard deviation to use for analysis, choose Compute for replicates in each response column.
3 Under Response, in the first row, enter Yield.
4 Under Store Std Dev, in the first row, type StdYield to name the column in which the standard deviations are stored.
5 Under Store Counts, in the first row, type NYield to name the column in which the number of replicates are stored. Click OK.
Data window output
Note
|
Preprocessing responses does not produce output in the Session window. Instead, columns are stored in the worksheet.
|
StdOrder
|
RunOrder
|
CenterPt
|
Blocks
|
Time
|
Temp
|
Catalyst
|
Yield
|
StdYield
|
NYield
|
3
|
1
|
1
|
1
|
20
|
200
|
A
|
45.1931
|
1.0240
|
8
|
24
|
2
|
1
|
1
|
50
|
200
|
B
|
59.6118
|
10.0303
|
8
|
35
|
3
|
1
|
1
|
20
|
200
|
A
|
44.8025
|
|
|
33
|
4
|
1
|
1
|
20
|
150
|
A
|
43.2365
|
0.2800
|
8
|
64
|
5
|
1
|
1
|
50
|
200
|
B
|
38.8697
|
|
|
47
|
6
|
1
|
1
|
20
|
200
|
B
|
47.2578
|
2.0003
|
8
|
29
|
7
|
1
|
1
|
20
|
150
|
B
|
42.3529
|
0.4915
|
8
|
30
|
8
|
1
|
1
|
50
|
150
|
B
|
40.7675
|
3.9723
|
8
|
58
|
9
|
1
|
1
|
50
|
150
|
A
|
48.4485
|
3.0456
|
8
|
42
|
10
|
1
|
1
|
50
|
150
|
A
|
49.7662
|
|
|
22
|
11
|
1
|
1
|
50
|
150
|
B
|
48.3112
|
|
|
55
|
12
|
1
|
1
|
20
|
200
|
B
|
46.2602
|
|
|
60
|
13
|
1
|
1
|
50
|
200
|
A
|
56.4470
|
8.0317
|
8
|
...
|
...
|
...
|
...
|
...
|
...
|
...
|
...
|
...
|
...
|
Giải thích kết quả
Trong thí dụ, Minitab tính và lưu lại các độ lệch chuẩn của các lập lại của Yield ở cộ StdYield .Minitab lưu một độ lệch chuẩn và số lập lại cho mỗi tổ hợp của các mức độ yếu tố . Ký hiệu (*) chỉ số liệu bị mất
Để phân tích tiếp tục sử dụng Analyze Variability . Giử worksheet này hoạt động để sử dụng các độ lệch chuẩn và số lập lại được lưu
Example of analyzing variability
Việc phân tích thí dụ này được tiến hành theo 2 bước . Trong bước 1, sử dụng least squares regression để làm thích hợp và rút gọn mô hình. Một khi xác định mô hình rút gọn thích hợp , trong bước hai, phân tích mô hình rút gọn bằng cách sử dụng maximum likelihood estimation để có các hệ số của mô hình cuối cùng.
Step 1: Analyze the design using least squares regression estimation
1 Choose Stat > DOE > Factorial > Analyze Variability.
2 In Response (standard deviations), enter StdYield.
3 Click Terms.
4 In Include terms from the model up through order, choose 2 from the drop-down list. Click OK.
5 Click Graphs. Under Effects Plots, check Normal, Half Normal, and Pareto. Click OK in each dialog box.
Session window output
Preprocess: Yield versus Time, Temp, Catalyst
Analysis of Variability: StdYield versus Time, Temp, Catalyst
Regression Estimated Effects and Coefficients for Ln of StdYield (coded units
Ratio
Term Effect Effec Coef SE Coef T P
Constant 0.7020 0.01879 37.35 0.017
Time 2.0371 7.6682 1.0185 0.01879 54.19 0.012
Temp 1.1491 3.1552 0.5745 0.01879 30.57 0.021
Catalyst 0.4300 1.5373 0.2150 0.01879 11.44 0.056
Time*Temp -0.2011 0.8178 -0.1005 0.01879 -5.35 0.118
Time*Catalyst -0.1861 0.8302 -0.0931 0.01879 -4.95 0.127
Temp*Catalyst 0.0159 1.0160 0.0079 0.01879 0.42 0.746
R-Sq = 99.98% R-Sq(adj) = 99.83%
Analysis of Variance for Ln of StdYield
Source DF Seq SS Adj SS Adj MS F P
Main Effects 3 136.942 136.942 45.647 1334.07 0.020
2-Way Interactions 3 1.824 1.824 0.608 17.77 0.172
Residual Error 1 0.034 0.034 0.034
Total 7 138.800
Regression Estimated Coefficients for Ln of StdYield (uncoded units)
Term Coef
Constant -7.33855
Time 0.114823
Temp 0.0323653
Catalyst 0.376572
Time*Temp -2.68115E-04
Time*Catalyst -0.0062036
Temp*Catalyst 0.0003176
Alias Structure
I
Time
Temp
Catalyst
Time*Temp
Time*Catalyst
Temp*Catalyst
|
Graph window output
Giải thích kết quả
Trong bước đầu của sự phân tích , sử dụng hồi qui bình phương nhỏ nhất (least squares regression) để làm thích hợp mô hình, xác định yếu tố nào có liên quan đến đáp ứng một cách có ý nghĩa. Một khi mô hình rút gọn được xác định, sử dụng phương pháp ước lượng tương đồng tối đa ( use maximum likelihood estimation (MLE) để xác định các hhe65 số của mô hình cuối cùng.
Trong thí dụ này, bảng ANOVA cung cấp bảng tóm tắt về các ảnh hưởng chính và các tương tác . Minitab trình bày cả hai Tổng bình phương : liên tiếp (the sequential sums of squares (Seq SS) và điều chỉnh (adjusted sums of squares (Adj SS). Nếu mô hình là trực giao và không có các hiệp biến thì hai tổng bình phương này sẽ bằng nhau . Phân tích giá trị p để xác định mức ý nghĩa của các ảnh hưởng . Kết quả cho thấy các tương tác hai chiều là không có ý nghĩa (p = 0.172). Các ảnh hưởng chính là có ý nghĩa ở mức 0.05 (p = 0.020).
Biểu đồ chuẩn , bán chuẩn và Pareto cho phép xác định bằng mắt các ảnh hưởng quan trọng và so sánh mức độ tương đối của các ảnh hưởng khác nhau . Biểu đồ xác nhận thời gian và nhiệt độ là có ý nghĩa ở mức 0.05 .
Ở điểm này cần rút gọn mô hình bằng cách sử dụng phương pháp hồi qui bình phương nhỏ nhất để xác định thành phần nào cần được giử lại trong mô hình . Với mục đích của thí dụ này mô hình với ảnh hưởng chính là thời gian , nhiệt độ và chất xúc tác được dùng như mô hình rút gọn . Mô hình này là một trong các mô hình rút gọn có thể được lựa chọn . Trong thực hành, cần làm thích hợp một số mô hình để tìm mô hình thích hợp.
Step 2: Analyze the reduced model using maximum likelihood estimation
1 Choose Stat > DOE > Factorial > Analyze Variability.
2 In Response (standard deviations), enter StdYield.
3 Under Estimation method, choose Maximum likelihood.
4 Click Terms.
5 In Include terms from the model up through order, choose 1 from the drop-down list. Click OK.
6 Click Graphs. Under Effects Plots, uncheck Normal, Half Normal, and Pareto. Click OK in each dialog box.
Session window output
Preprocess: Yield versus Time, Temp, Catalyst
Analysis of Variability: StdYield versus Time, Temp, Catalyst
MLE Estimated Effects and Coefficients for Ln of StdYield (coded units)
Ratio
Term Effect Effect Coef SE Coef Z P
Constant 0.7213 0.09449 7.63 0.000
Time 2.0379 7.674 1.0189 0.09449 10.78 0.000
Temp 1.1559 3.177 0.5779 0.09449 6.12 0.000
Catalyst 0.4374 1.549 0.2187 0.09449 2.31 0.021
MLE Estimated Coefficients for Ln of StdYield (uncoded units)
Term Coef
Constant -5.70171
Time 0.0679285
Temp 0.0231172
Catalyst 0.218693
Alias Structure
I
Time
Temp
Catalyst
|
Giải thích kết quả
Sau khi chọn mô hình rút gọn thích hợp bằng cách dùng phương pháp ước lượng bình phương nhỏ nhất, làm thích hợp mô hình trở lại bằng cách dùng phương pháp ước lượng tương đồng tối đa để có các ảnh hưởng và các hệ số chính xác nhất. Kết quả cho thấy :
Thời gian có ảnh hưởng mạnh nhất ở 2.0379. Ảnh hưởng tỉ số ( ratio effect) cho thấy độ lệch chuẩn gia tăng với hệ số 7.7 khi thời gian thay đổi từ mức thấp lên mức cao.
Nhiệt độ có ảnh hưởng mạnh kế đó vo71o 1.1559. Ảnh hưởng tỉ số cho thấy độ lệch chuẩn gia tăng với hệ số 3.2 khi nhiệt độ thay đổi từ mức thấp lên mức cao.
Chất xúc tác có ảnh hưởng nhỏ nhất với .4374. Ảnh hưởng tỉ số cho thấy độ lệch chuẩn gia tăng với hệ số 1.5 khi chất xúc tác thay đổi từ mức thấp lên cao.
Cần vẽ các sai số theo thứ tự run để kiểm tra đường khuynh hướng thời gian hay những yếu tố không ngẩu nhiên khác .
Chia sẻ với bạn bè của bạn: |