Thiết kế nghiên cứU & thống kê y họC



tải về 0.72 Mb.
trang4/7
Chuyển đổi dữ liệu19.07.2016
Kích0.72 Mb.
#1981
1   2   3   4   5   6   7

Phân tích PP, tỉ lệ BN thất bại điều trị nhóm Gatigloxacin là 13/145 (9%) và Azithromycin là 13/140 (9,3%) (logrank test p=0,854, HR=0,93 [KTC95%: 0,43-2,0]). Giả dụ trong tình huống xấu nhất tất cả BN bỏ dở điều trị đều thất bại thì tỉ lệ thất bại ở nhóm Azithromycin là 15/142 (10,6%) (logranktest p=0,570, HR=0,81[0,38-1,70].

Thất bại vi sinh trong nhóm Gatifoxacin là 2/145 (1,4%) và nhóm Azithromycin là 3/142 (2,2%) (p=0,680, OR=0,64 [0,05-5,7]

Không có biến chứng nào xảy ra trong nhóm Gatifloxacin so sánh với 8 ca có biến chứng trong nhóm Azithromycin (5,7%) (p=0,003, OR=0 [0-0,4].




a : Loại bỏ 102 (đã dùng KS n=41, Thương hàn có biến chứng n=8, Tuổi < 6 tháng n=6, từ chối tham gia n=16, BS nhóm nghiên cứu vắng n=30, Dị ứng thuốc n=1)

b: ITT: Intention to treat (Phân tích theo phân bổ ngẫu nhiên ban đầu)

c: PP: Per protocol (phân tích theo qui trình)

Biểu đồ 3. Các đối tượng tham gia nghiên cứu trong từng giai đọan

Bảng 1. Kết cục điều trị giữa 2 nhóm.

Loại kết cục

Nhóm điều trị

Gatifloxacin n=145

Azithromycin n=142

P

Chính (primary): TG cắt sốt (giờ)

106 (94-118)

106 (88-112)

0,984

Phụ : Điều trị thất bại n (%)

13/145 (9)

13/140 (9,3)

0,854

Không hòan tất điều trị n (%)

0

2

Thất bại lâm sàng n (%)

6/145 (4,3)

6/140 (4,2)

1,000

Thất bại vi sinh n (%)

2/145 91,40

3/140 (2,2)

0,680

Biến chứng n (%)

0/145 (0)

8/140 (5,7)

0,003

Xuất huyết tiêu hóa

0

4

Viêm phổi

0

2

Rối lọan chức năng gan

0

2

Tái phát sau xuất viện n (%)

4/137 (2,9)

0/127 (0)

0,052

Mang trùng ở phân n (%)

1/137 90,7)

0/131 (0)



Giới hạn của đề tài nghiên cứu:

- Phân bổ ngẫu nhiên với khối lớn (50 đối tượng) do đó có sự chênh lệch đối tượng giừa nhóm (186 so với 172 bệnh nhân trong dân số ITT)

- Tỉ lệ cấy phân dương tính với S. typhi thấp. Kết quả người mang trùng trong phân đều thấp cả 2 nhóm, tuy nhiên giả thuyết rằng cả Azithromycin và nhóm Fluoroquinolone có nồng độ thuốc trong nội bào cao và thấm vào mô tốt nên diệt khuẩn nhanh và lọai trừ nhanh ra khỏi cơ thể làm giảm tỉ lệ mang trùng ở phân.

- Cả 2 nhóm thuốc, đặc biệt ở trẻ em, phải nghiền thuốc để phân liều do đó liều lượng không chính xác 10mg/kg/ngày cho Gatifloxacin và 20mg/kg/ngày cho Azithromycin.

Kết luận:

Cả 2 kháng sinh Gatifolxacin và Azithromycin đều có tính an toàn và hiệu quả cao trong điều trị thương hàn, đặc biệt ở các vùng có bệnh thương hàn đa kháng thuốc và kháng nalidixic acid cao. Gíá thành điều trị 7 ngày của Gatifloxacin rẻ hơn và bằng 1/3 so với giá thành điều trị của Azithromycin.

Tài liệu tham khảo:


1. Phạm gia Khải và CS. Tần số tim và trị số huyết áp động mạch người lớn Việt nam bình thường thập kỷ 90. Bảng thảo hằng số sinh học người Việt nam thập kỷ 90.

2. Phil Haln. Cách tính cỡ mẫu trong Study design, bài giảng của GS Phil Haln ở Đại học Queen’ University, Canada

3. Moore D.S. and McCabe G.P. Producing data in Introduction to the Practice of Statistics, 3rd Edition. W.H. freeman and Company 1999 USA, pp: 240.

4. Montori V.M. and Guyatt G.H. Intention-to-treat principle (commentary) .CMAJ • November 13, 2001; 165 (10)


5. Dolecek C, Tran TP, Nguyen NR, Le TP, Ha V, Phung QT, Doan CD, Nguyen TB, Duong TL, Luong BH, Nguyen TB, Nguyen TA, Pham ND, Mai NL, Phan VB, Vo AH, Nguyen VM, Tran TT, Tran TC, Schultsz C, Dunstan SJ, Stepniewska K, Campbell JI, To SD, Basnyat B, Nguyen VV, Nguyen VS, Nguyen TC, Tran TH, Farrar J. A multi-center randomised controlled trial of gatifloxacin versus azithromycin for the treatment of uncomplicated typhoid fever in children and adults in Vietnam. PLoS ONE. 2008 May 21;3(5):e2188.

6. Nguyễn Văn Tuấn. Phân tích sự kiện (survival analysis), trong Phân tích số liệu và tạo biểu đồ bằng R. Nhà xuất bản KH và KT, Thành phố HCM 2007, tr: 238-259.

PHÂN PHỐI CHUẨN (NORMAL DISTRIBUTION)

Phân phối chuẩn (normal distribution) được nêu ra bởi một người Anh gốc Pháp tên là Abraham de Moivre (1733). Sau đó Gauss, một nhà toán học ngưới Đức, đã dùng luật phân phối chuẩn để nghiên cứu các dữ liệu về thiên văn học (1809) và do vậy cũng được gọi là phân phối Gauss. Theo từ điển bách khoa về khoa học thống kê, có lẻ người đầu tiên dùng từ “normal” là ông C.S Pierce (1780) vì vào thời đó người ta cho rằng mọi hiện tượng tự nhiên được coi như có phân phối chuẩn nhưng thật ra còn có những luật phân phối khác. Tuy vậy hầu hết lý thuyết thống kê được xây dựng trên nền tảng của phân phối chuẩn.

Như vậy từ “normal” được dùng theo thói quen nhưng thực ra không đúng, vì vậy trong tiếng Việt ta không thể dịch là phân phối “bình thường” mà gọi là phân phối chuẩn.

Hai thông số quan trọng trong một phân phối là giá trị trung tâm hay gọi là trung bình µ và phương sai 2 (hoặc độ lệch chuẩn ) và thường biểu thị bằng X ~ N (µ,2) (N viết tắt từ normal).

Nếu phân phối chuẩn được chuẩn hóa với trung bình =0 và độ lệch chuẩn =1, được viết tắt là: Z ~ N (=0, =1), được gọi là phân phối chuẩn chuẩn hóa (standardized normal distribution) nghe có vẻ không được xuôi tai như tiếng Anh vì chữ normal được dịch là chuẩn rồi, do vậy dùng từ phân phối chuẩn tắc có vẻ ổn hơn !

Nói chung các đặc tính sinh trắc học của người khỏe mạnh (cân nặng, chiều cao, trị số mạch, huyết áp, đường máu, số lượng hồng cầu), thường tuân theo luật phân phối chuẩn. Ví dụ: xét nghiệm đường máu 100 người lớn khỏe mạnh các kết quả thu thập trong bảng 1.



Bảng 1. Kết quả đường máu (mg%) 100 người lớn khỏe mạnh

 

 

 

 

 

 

 

 

 

 

97

100

110

106

103

108

97

92

113

112

88

100

95

101

124

95

111

99

84

93

82

115

88

85

79

90

100

104

109

100

90

84

102

98

93

102

102

102

110

109

90

114

106

115

103

89

93

83

100

106

100

111

101

88

80

89

103

91

91

119

97

116

118

117

95

92

123

81

102

95

106

106

94

103

96

89

94

122

110

100

80

108

101

111

98

97

105

105

98

86

105

97

87

111

107

115

96

110

79

107

 

 

 

 

 

 

 

 

 

 

Bảng 2. Biểu đồ cuống-lá của đường máu:
























4


































3


































3


































3


































3































9

2































8

2

9




























8

2

9

























4

8

2

8

























4

7

2

8

4






















3

7

1

7

3



















9

3

7

1

7

2



















9

3

7

1

6

1
















4

9

2

7

0

6

1

9













4

8

2

6

0

6

1

8













3

8

1

6

0

6

1

7













2

8

1

5

0

6

0

6













1

7

0

5

0

5

0

5

4







9

0

6

0

5

0

5

0

5

3







9

0

5

0

5

0

5

0

5

2








































70

80

80

90

90

100

100

110

110

120

Tần số:

2

7

9

12

15

20

14

11

7

3

Nhìn vào biểu đồ thân-lá ta thây có:

2 người có trị đường máu <80mg%: 2%

14 người có trị đường máu 80-89mg%: 14%

34 người có trị đường máu 90-99mg%:34%

34 người có trị đường máu 100-109mg%: 34%

13 người có trị đường máu 110-119mg%: 13%

3 người có trị đường máu >120 mg%: 3%

Và biểu đồ tần suất (histogram) của phân phối đường máu (hình 1):

Hình 1. Phân phối đường máu của 100 người lớn khỏe mạnh

Như vậy ta thấy phân phối lượng đường máu tuân theo luật chuẩn với trị số trung bình µ=100 và độ lệch chuẩn =10 với:

68% giá trị quan sát nằm trong khoảng  của µ.

95% giá trị quan sát nằm trong khoảng 2 của µ.

99,7% giá trị quan sát nằm trong khoảng 3 của µ.

(còn gọi là luật 68-95-99,7)

Hàm mật độ phân phối chuẩn (Normal density probability function) có dạng tổng quát như sau:



Trong đó:  = 3,14159...

e = 2,71828... (cơ số logarit Neper)

µ: trị số trung bình

 : độ lệch chuẩn

Biến ngẫu nhiên X có đơn vị là mg% bây giờ ta muốn chuyển đơn vị đo lường của biến số X theo đơn vị đo lường tổng quát cho mọi phân phối chuẩn nghiã là theo đơn vị độ lệch chuẩn. Lúc đó phân phối chuẩn theo X sẽ trở thành phân phối chuẩn tắc (Standadized normal distribution) theo biến số mới là Z.

Muốn đổi hàm y=f(x) ra hàm chuẩn tắc y=f(z) ta đặt:

Thế =100 và =10 ta có:



Như vậy khi: x=80  z=-2

x=90  z=-1

x=100  z=0

x=110  z=+1

x=120  z=+2

Và đường cong chuẩn y=f(z) sẽ là:

Hình 2. Biến đổi phân phối chuẩn (biến X) thành phân phối chuẩn tắc (Z)

Như vậy đường cong chuẩn tắc y= f(z) có trị trung bình=0 và độ lệch chuẩn=1

Tóm lại: Biến X tuân theo luật chuẩn với trung bình  và phương sai 2 thường được viết tắt là: X ~ N (,2 ) và biến Z tuân theo phân phối chuẩn tắc có =0 và 2=1 được viết là Z ~ N(0,1). Như vậy lúc này Z có đơn vị là độ lệch (ví dụ: 1, 2 hoặc 3 độ lệch chuẩn so với trị trung bình) và không tùy thuộc vào đơn vị đo lường theo biến X (ví dụ. mg% đường máu).

Phương trình đường cong chuẩn tắc theo Z sẽ là::




Hình 3. Diện tích dưới đường cong chuẩn từ 0 +1

Lúc này muốn biết xác suất đường máu từ 100-110mg% (theo X) chỉ cần tính xác suất từ 0 đến 1 đơn vị độ lệch chuẩn theo Z hoặc tìm diện tích dưới đường cong từ 0 đến 1 (phần màu đậm-hình 3). Tích phân của hàm f(z) từ 0  1 chính là diện tích dưới đường cong này. Trong thống kê gọi f(Z) là hàm xác suất chuẩn tích lũy (cummulative normal probability function)



Công thức tính tích phân hàm F(z) khá rắc rối thường ta dùng bảng Z-score (phần phụ lục) để tính. Xem bảng khi z=0 z=1: F(z)=0,34


Như vậy xác suất P (0 ≤ Z ≤1) là 0,34 hoặc xác suất những người có trị đường máu từ X=100mg% (tương đương với Z=0) đến X=110 mg%(tương đương với Z=1) là 34% (biểu đồ )
Các khoảng đặc biệt có thể tính nhẩm xác suất:






Một ví dụ khác: Muốn tính xác suất của z từ - đến 1,2 ta lấy: xác suất khoảng từ - đến 0 là p=0,50 cộng với xác suất khoảng từ 0 đến 1,2 là 0,38 (xem bảng z-score phần phụ lục), tổng cộng 2 xác suất này là 0,88 (tương đương 88% người có đường máu 115mg%) (1 đơn vị z bằng 10mg%)

Trong thống kê có một vị trí rất thông dụng, được nhắc đi nhắc lại nhiều lần đó là Z=1,96 và giá tri tới hạn (critical value) Zα =0,05 (2 đuôi), vị trí mà thống kê cho rằng các giá trị nào nằm ngoài khoảng này được coi như bất thường (p=0,05). Giá trị tới hạn này cũng được dùng nhiều nhất trong thống kê y học để xác định mức có ý nghĩa thông kê (bác bỏ 1 giả thuyết không). Nếu Z >1,96, p<0,05) bác bỏ giả thuyết không và Z <1,96 chấp nhận giả thuyết không.



Hình 4. Giá trị tới hạn (critical value) của phân phối chuẩn Z

Tài liệu tham khảo:

1. Armitage P. and Berry G. The normal distribution, in Statistical methods in medical research, 3rd edition, Backwell Scientific publication 1994, pp;66-71.

2. Altman DG. The normal distribution. statistic notes.BMJ 1995; 310:298.

3. Website: http://www.stat.wvu.edu/SRS/Modules/Normal/normal.html truy cập ngày 12/02/09.


TS Nguyễn ngọc Rạng, bvag.com.vn

Phụ lục. Bảng tính diện tích dưới đường cong chuẩn (hay xác suất tích lũy)


PHÂN PHỐI NHỊ THỨC (BINOMIAL DISTRIBUTION)

Trong phân phối chuẩn biến ngẫu nhiên là biến số liên tục (cân nặng, chiều cao, trị số đường máu..) Bây giờ ta hãy xem biến ngẫu nhiên là biến rời rạc (discrete) hoặc gọi là biến phi liên tục, kết cục chỉ có 2 tình huống xảy ra như: sống/chết, có bệnh/không bệnh, trai/gái… phân bố như thế nào.

Ví dụ. Thử tung 1 đồng xu, đương nhiên mỗi lần tung có kết cục độc lập, có nghĩa là kết cục ra Sấp (S), Ngửa (N) lần sau không tùy thuộc vào kết quả S,N của lần tung trước, như vậy xác suất p(N)=1/2 và xác suất p (S)=1/2. Nếu ta tung 4 lần và muốn ra mặt N, thì ta có thể dự đoán xác suất được 2 lần N là cao nhất, sau đó là được 1N hoặc 3 N và cuối cùng là cả 4 lần tung đều ra N hoặc không có mặt N ( hoặc 4 S) có xác suất thấp nhất.

Như vậy làm sao để tính xác suất để có 0,1,2,3,4 mặt ngửa (N) sau 4 lần tung?



Cách tính 1:

Ta biết xác suất “thực” của mặt ngửa là ½ (p=0,5) và mặt sấp cũng ½ (q=0,5)

Gọi k là số lần được mặt ngửa, tính xác suất với k=0,1,2,3,4:











SNNS
















SNSN













SSSN

SSNN

NNNS










SSNS

NSSN

NNSN










SNSS

NSNS

NSNN







SSSS

NSSS

NNSS

SNNN

NNNN

K =

0

1

2

3

4

Biểu đố 1: Các tình huống xảy ra sau 4 lần tung (n=4)

k=0: xác suất để không (k=0) được mặt N nào là: SSSS= q.q.q.q (qui tắc nhân xác suất) = 0,5X0,5X 0,5X 0,5= 0,5 4 = 0,0625

k=1: có 4 tình huống được 1 mặt N  P (k=1) = 4. 0,5 4= 0,25

k=2: có 6 tình huống được 1 mặt N  P (k=2) = 6. 0,5 4= 0,375

k=3: 4 tình huống được 3 mặt N  P (k=3) =4. 0,54= 0,25

k=4: chỉ có 1 tình huống duy nhất  P (k=4) = 0,54 =0,0625
Cách tính 2:

Dùng nhị thức Newton:



(p+q)4= p4 +4 p3q + 6p2q2 + 4pq3+q4

(0,5+0,5)4= 0,54 +4x 0,54 + 6X 0,54 + 4x 0,534 +0,54

k=0 tương ứng số hạng thứ 1: 0,54

k=1 tương ứng số hạng thứ 2: 4X 0,54

k=2 …………………….. 3: 6X 0,54

k=3 …………………….. 4: 4X 0,54

k=4 …………………….. 5: 0,54

Bây giờ ta gọi X(k=0,1,2…) là biến ngẫu nhiên trên trục hoành và p là tần số xác suất được mặt ngửa trên trục tung và vẻ biểu đồ phân phối (xem biểu đồ 2)





Biểu đồ 2. Biểu đồ phân phối nhị thức với n=4
Tổng quát hóa hàm phân phối nhị thức được phát biểu như sau:

Một thử nghiệm với n lần thử độc lập

Gọi p là xác suất “thành công” (ví dụ. ra mặt ngửa)

Thì xác suất của k lần thử nghiêm thành công là:






P (k,n,p) =Cnk pk (1-p)n-k trong đó k=0,1,3…..,n.
Cnk = n! ( Tổ hợp n chập k)

n! (n-k)!

Nếu n=12, dùng công thức tính:

P (k=0,12,0,5)= 12! (0,5)12 =0,000244

12! (12!)

P (k=1,12,0,5)= 12! (0,5)11 = 0,00292

12! (11!)

P (k=2,12,0,5)= 12! (0,5)10 = 0,01612

12! (10!)

……………….

P (k=6,12,0,5)= 12! (0,5) 6 = 0,2255



12! (6!)

………….


P (k=12,12,0,5)= 12! (0,5)12 = 0,0000244

12! (12!)



Cách tính 3.

Vào phần mềm R với lệnh đơn giản: dbinom (k,n,p)

Ví dụ: tính xác suất với k=6, n=12 và p=0,5:

>dbinom (6,12,0.5) thì P= 0,2255



Biểu đồ 3. Biểu đồ phân phối nhị thức với n=12
Và khi n càng tăng dần, phân phối nhị thức có dạng phân phối chuẩn với trị số trung bình = np và phương sai 2= np(1-p) theo định luật giới hạn trung tâm (central limit theorem).



Biểu đồ 4. Biểu đồ phân phối nhị thức với n=100

Nhìn vào biểu đồ 4 với n lớn (n=100) chúng ta thấy phân phối nhị thức có phân phối chuẩn với trị trung binh là =np=100 x 0,5=50 và phương sai 2= 100 x 0,5 x 0,5= 25 hoặc độ lệch chuẩn =5.


Ứng dụng phân phối nhị thức:

Ví dụ 1. Biết tỉ lệ suy dinh dưỡng ở trẻ em dưới 5 tuổi là 20%. Nếu chúng ta khám 10 trẻ dưới 5 tuổi. Tính xác suất để có 2 em bị suy dinh dưỡng.

Như vậy k=2, n=10 và p=0,20

Xác suất có 2 trẻ bị suy dinh dưỡng.

P (k=2,10,0,2)= 10! (0,2)2x (0,8)8 =0,30

10! (8!)

hoặc tính trong R:



>dbinom (2,10,0.2)=0,30

Kết quả: Xác suất để có 2 em bị suy dinh dưỡng là 30%


Ví dụ 2. Tỉ lệ suy dinh dưỡng trẻ em 20% (như ví dụ trên).Tính xác suất để có ít hơn 2 em bị suy dinh dưỡng.

Như vậy tính tổng xác suất của: P(k=0)+P(k=1)+ P(k=2)

Hoặc dùng hàm nhị thức tích lũy (cummulative binomial probability):

tính P (X  2) :



> pbinom(2,10,0.2)= 0,67
Tài liệu tham khảo:

1. Nguyễn Văn Tuấn. Hàm phân phối nhị phân, trong Phân tích số liệu và tạo biểu đồ bằng R. Nhà xuất bản KH và KT, Thành phố HCM 2007, tr: 47-50.

2. Moore D.S. and McCabe G.P. Discrete random variables, in Introduction to the Practice of Statistics, 3rd Edition. W.H. Freeman and Company 1999 USA, pp: 313-317.

TS Nguyễn ngọc Rạng, bvag.com.vn




PHÂN PHỐI T VÀ PHÉP KIỂM T STUDENT

1. Lịch sử của phân phối T Student.

Cha đẻ của phân phối T student là W.S Gosset. Ông được nhận làm việc tại hãng bia nổi tiếng Guinness ở Dublin, Ai len vào năm 1899 sau khi tốt nghiệp khoa Hóa tại Đại học Oxford lúc 23 tuổi. Để bảo đảm chất lượng bia khi lên men cần phải ước tính chính xác số lượng men (yeast) cần thêm vào, nếu thiếu sẽ làm giảm hương vị, nếu dư sẽ làm tăng vị đắng của bia, tuy nhiên không thể đếm được tổng thể các khúm men (colonies). Gosset đã lấy nhiều mẫu (samples) nhỏ con men và từ đó suy ta lượng men tổng thể (population). Công trình nghiên cứu này được công bố trên tờ Biometrica vào năm 1907 với tên giả là “Student” với tựa là “Sai số đếm với buồng đếm tế bào” (On the Error of Counting With a Hemacytometer). Vì vấn đề bảo mật của công ty nên ông chỉ được phép đăng bài với tên giả này. Sau đó ông thực hiện một nghiên cứu khác về phân phối T, Ông đo chiều cao (h) và

William Sealy Gosset 1908 chiều dài (l) ngón tay giữa trái của 3000 phạm nhân, ghi tất cả các số liệu này lên tấm bìa, cắt ngẫu nhiên ra 750 tấm bìa nhỏ, như vậy trong mỗi tấm bìa chỉ có số liệu h và l của 4 phạm nhân, tính trung bình m (mean) và phương sai s2 (độ lệch chuẩn s) của tất cả 750 mẫu nhỏ này và suy đoán trung bình  và độ lệch chuẩn  của dân số (3000 phạm nhân). Công trình nổi tiếng này cũng được công bố trên tờ Biometrika vào năm 1908 với tên giả là “Student” và tựa là “Sai số có thể của trị trung bình” (The Probable Error of a Mean).

Như vậy từ mẫu nhỏ (với trung bình m, độ lệch chuẩn s) ta có thể suy đóan trung bình µ và độ lệch chuẩn  của dân số. Một ví dụ minh họa sau đây:

Chiều cao trung bình nam thanh niên Việt nam trên 18 tuổi là 163 cm và độ lệch chuẩn (SD) là 4 cm (Theo quyển hằng số sinh học của người Việt nam thập kỷ 90). Tạm gọi đây là trị trung bình µ và độ lệch chuẩn  của dân số, thực ra trị số “thực” của µ và  chỉ có được khi đo chiều cao của khoảng 30 triệu thanh niên nam này!.

Bây giờ ta thử suy đoán µ và  sẽ như thế nào nếy ta rút ra 3 mãu có N=5,10 và 20 thanh niên Việt nam bất kỳ và đo chiều cao các thanh niên trong các mẫu này. Kết quả chiều cao (cm) trình bày trong bảng 1.


Bảng 1. Chiều cao thanh niên Việt nam với 3 mẫu bất kỳ





N=5

N=10

N=20




160

160

160




165

165

165




170

170

175




155

155

155




160

160

160







150

150







175

175







160

160







160

160







175

175










170










155










165










155










175










160










160










165










170










170

mean

162

163

164

SD

5.7

8.2

7.7

SE

2.5

2.7

1.7

t=0.05

2.776

2.262

2.093

KTC 95%

6.94

6.1074

3.5581

Dao động

155-169

157-169

160-168


mean: Trị trung bình; SD: độ lệch chuẩn, SE: sai số chuẩn, t=0.05: giá trị tới hạn (2 đuôi); KTC 95%: khoảng tin cậy 95%

DF: Bậc tự do (n-1)
Công thức tính KTC 95%: mean ± t=0.05x SE (với SE= SD )

Như vậy trị số  của dân số (163cm) đều nằm trong KTC 95% của mẫu với N=5,10 và 20.


2. Phân phối T Student.

Nếu phân phối chuẩn tắc có dạng Z ~ N (0,1) thì phân phối t có dạng T ~ (0, v/v-2) trong đó v là bậc tự do và v/v-2 là phương sai. như vậy khi v lớn (>30) thì v/v-2 gần bằng 1 và T có phân phối chuẩn tắc.



Biểu đồ 1. Sự tương quan giữa phân phối chuẩn tắc N (0,1) và phân phối T (0,v/v-2)

Trong phân phối chuẩn, 95% số liệu nằm trong khoảng Z=-1,96 đến Z=+1,96 (#2 SD). Nếu độ tự do v=1, 95% số liệu nằm trong khoảng t=-12,706 đến t=+12,706. Khi v=5 , 95% số liệu nằm trong khoảng t=-2,570 đến t=+2,570 và khi v=30, 95% số liệu nằm trong khoảng t=-2 đến t=+2. Như vậy, khi v 30 thì phân phối T được coi như phân phối chuẩn tắc và có giá trị tới hạn t= Z=1,96


3. Ứng dụng phép kiểm T trong thống kê:

Phép kiểm T là phép kiểm được dùng nhiều nhất trong thống kê để xử lý các biến số. Trong các phần mềm thống kê thông dụng như Epi-info, SPSS, Strata... chúng ta chỉ thấy phép kiểm T mà không thấy phép kiểm Z (dựa trên phân phối chuẩn). Thực ra phép kiểm hay phân phối T được suy diễn từ phân phối chuẩn, với mẫu bé (n=5, 10,15...) chúng ta chỉ cần hiệu chỉnh Z=1,96 ra T. Nếu mẫu càng bé (bậc tự do nhỏ), T càng lớn (xem biểu đồ 1)


Ví dụ 1. Nếu một người X có trị đường máu=120mg% so sánh với trị trung bình đường máu của 100 người bình thường có phân phối chuẩn (=100, =10), hỏi có sự khác biệt giữa trị đường máu của người X và trung bình mẫu có ý nghĩa thống kê?
Giải: Vì có phân phối chuẩn nếu trị đường máu của người X lớn hơn 1,96 SD ta nói có sự khác biệt, nếu <1,96 thì không khác biệt.

Z= X- = 120-100 =2 >1,96: có khác biệt



  • 10

Nếu so sánh trị đường máu của người X trên với mẫu 6 người bình thường (bậc tự do=5) thì Z lúc đó phải > 2,57 (giá trị tới hạn của T với bậc tự do=5) và như vậy không có sự khác biệt trị đường máu của người X và trung bình mẫu.


4. Ứng dụng phép kiểm T trong SPSS

4.1 Phép kiểm T một mẫu :

Ví dụ 1: Thực hiện ngoại kiểm tra, 5 mẫu đường máu (đều có trị số thực là 100mg%) được gởi cho 1 phòng xét nghiệm A. Kết quả 5 mẫu đường máu tại phòng xét nghiệm A như sau: 100; 101; 102; 103; 104. Hỏi chất lượng của phòng xét nghiệm A?
Giải:

Giả thuyết không: Ho: m= µ ; Ha: m  µ



với m=100+101+102+103+104/5=102

SD2= (100-100)2+(100-101)2 +(100-102)2 +(100-103)2 +(100-104)2 = 2.5

n-1


SD=1.58

Tra bảng với bậc tự do =4 : t= 2.77. Như vậy T >2,77  bác bỏ giả thuyết không, có sự khác biệt giữa mẫu máu gởi đến so với kết quả của phòng xét nghiệm A. Kết luận: Chất lượng phòng xét nghiệm A chưa đạt

Test T 1 mẫu trong SPSS

Analyze>Compare Means>One-sample T test

Nhắp glucose chuyển qua ô Test variables

Gõ 100 (trị đường máu thực sự) vào ô Test Value


Nhắp OK

Kết quả kiểm định T 1 mẫu :




N: số mẫu máu; Mean: trị trung bình; Std. Deviation: Độ lệch chuẩn; Std. Error Mean: Sai số chuẩn= SD/n; t=2.828 (giá trị tới hạn t 2 đuôi); df: bậc tự do (n-1); Sig 2-tailed): ý nghĩa TK ( 2 đuôi) p<0.047; Mean difference: Sai biệt giữa TB mẫu và trị lý thuyết (m-µ)

Kết luận: t=2,828, df=4, p=0,047: sự khác biệt có ý nghĩa thống kê, như vậy kết quả của phòng xét nghiệm A chưa đạt.

4. 2 T test 2 mẫu độc lập:

Ví dụ 2 : Nghiên cứu số lượng tiểu cầu của 2 nhóm bệnh nhân (n=10) mắc sốt dengue (SD) và sốt xuất huyết dengue (SXH). Kết quả thu được như sau (x103/mm3)

Nhóm SD: 150, 140, 170, 160, 90, 240, 100, 140, 120, 90

Nhóm SXH: 100, 130, 80, 70, 40, 30, 120, 130, 20, 80

Có sự khác biệt trung bình giữa 2 nhóm



Giải:

Giả thuyết Ho: m1=m2; Ha: m1m2




m1 = 150+140+170+160+90+240+100+140+20+90= 140

10

m2= 100+130+ 80+ 70+ 40+ 30+ 120+130+20+ 80 = 80


10

SD12= (150-140)2+….+ (90-140)2= 2044

9

SD22= (100-80)2+….+ (90-80)2= 1504



9

SE12 = SD12 = 204,5

n1

SE22 = SD22 = 163,8



n2

T= I140-80I



T= 3,124


Với bậc tự do= 18 T= 2,101

Như vậy T (3,124) > T (2,101) bác bỏ Ho. Nhóm SD có tiểu cầu cao hơn SXH
Test T 2 mẫu độc lập trong SPSS

Analyze>Compare Means>Independent-Samples T Test

Nhắp trị TC (tiểu cầu) qua ô Test variables

Nhắp nhom vào ô Grouping variable

Nhắp Define Groups

Khai báo group 1 =SD; group 2 = SXH

Nhắp Continue



Nhắp OK cho kết quả như sau:





N: số mẫu máu; Mean: trị trung bình; Std. Deviation: Độ lệch chuẩn; Std. Error Mean: Sai số chuẩn= SD/n;Levene’s test for Equality of Variances: Kiểm định bằng nhau về phương sai (nếu sig>0,05, 2 nhóm có phương sai tương đương, chọn t ở hàng trên); df: bậc tự do= n1+n2-2=18, Sig. (2-tailed): ý nghĩa TK ( 2 đuôi) p<0.006.

Kết luận: bác bỏ Ho  2 nhóm có trị tiểu cầu khác nhau có ý nghĩa thống kê với p=0,006
4. 3 Kiểm định T với mẫu bắt cặp:

Ví dụ: Điều trị 8 bệnh nhân bằng thuốc hạ máu X, kết quả trước và sau điều trị như sau:
Trước ĐT: 160, 155, 145, 150, 145, 150, 165,170

Sau ĐT: 145, 135, 145, 150, 130, 130, 135, 150

Chênh lệch: 15 + 20 + 0 + 0 + 15 + 20 +30 +20 = 120

Giá trị trung bình của các chênh lệch: = 120/8= 15

Phương sai của các chênh lệch :

S 2 = (15-15)2+ (20-15)2+(15-15)2 +(20-15)2 +(30-15)2 = (20-15)2 = 107,2

7

S =  = 10,35



Ta có

Với df=7, t=0,025= 2,36

Kết luận : T >2,36  bác bỏ Ho: có sự chênh lệch HA sau điều trị (thuốc X có tác dụng hạ huyết áp thực sự)
Test T mẫu bắt cặp trong SPSS

Analyze>Compare Means>Paired-Samples T Test

Nhắp cặp Truoc-Sau cùng lúc qua ô Paired variables


Nhắp OK cho kết quả như sau:



Độ chênh lệch trung bình=15; độ lệch chuẩn (SD)=10,35

t=4,099, bậc tự do df=7, ý nghĩa thống kê: p=0,005

Kết luận: Thuốc X có tác dụng hạ áp tốt

TS Nguyễn ngọc Rạng, bvag.com.vn



Tài liệu tham khảo:

1. Tonse N.K. Raju. William Sealy Gosset and William A. Silverman: Two "Students" of Science. Pediatrics,Vol. 116 No. 3 2005, pp. 732-735.

Каталог: wp-content -> uploads -> 2013
2013 -> 1. Most doctors and nurses have to work on a once or twice a week at the hospital
2013 -> ĐỀ CƯƠng ôn tập bài kiểm tra 15 phút môn hóA 9 LẦN 1 vq1: Nêu
2013 -> Mãng cäc thiÕt diÖn nhá Tiªu chuÈn thi c ng vµ nghiÖm thu Minipile foundation Standard for constrution, check and acceptance
2013 -> BỘ XÂy dựng số : 14/ 2003/ QĐ-bxd cộng hoà XÃ HỘi chủ nghĩa việt nam
2013 -> Chương dao đỘng cơ
2013 -> Số Hồ sơ: 101/ /thu cộng hòa xã HỘi chủ nghĩa việt nam độc lập Tự do Hạnh phúc phiếu giao nhận hồ SƠ Loại hồ sơ: Đăng ký bhxh, bhyt bắt buộc
2013 -> Số Hồ sơ: 103/ /thu cộng hòa xã HỘi chủ nghĩa việt nam số Hồ sơ: 103/ /thu-đC Độc lập Tự do Hạnh phúc
2013 -> Số Hồ sơ: 107/ /thu cộng hòa xã HỘi chủ nghĩa việt nam độc lập Tự do Hạnh phúc
2013 -> Niên Lịch Phụ Huynh/Học Sinh
2013 -> 20 tcn 33 – 1985 CẤp nưỚc mạng lưỚi bên ngoài và CÔng trình tiêu chuẩn thiết kế (Trích)

tải về 0.72 Mb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương