SỰ CẦn thiết và Ý nghĩa của việc sử DỤng xác suất thống kê trong nghiên cứu giáo dục học và CÁc khoa học xã HỘI



tải về 113.98 Kb.
Chuyển đổi dữ liệu10.02.2018
Kích113.98 Kb.
#36295
SỰ CẦN THIẾT VÀ Ý NGHĨA CỦA VIỆC SỬ DỤNG XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU GIÁO DỤC HỌC VÀ CÁC KHOA HỌC XÃ HỘI

Tác giả: Trần Văn Công, Bahr Weiss

Tóm tắt: Khi các nhà khoa học xã hội Việt Nam thực hiện các nghiên cứu của mình, họ có thể dùng hoặc không dùng đến xác suất thống kê trong phân tích dữ liệu, nhưng nhiều người có thể chưa biết đến tầm quan trọng cũng như giá trị mà xác suất thống kê có thể mang lại cho nghiên cứu của mình. Bài báo này nhằm bàn luận về ý nghĩa của việc sử dụng xác suất thống kê trong nghiên cứu giáo dục học cũng như các khoa học xã hội. Ngoài những khái niệm quen thuộc đối với độc giả, chúng tôi cũng giới thiệu một vài mô hình thống kê cao cấp đang được sử dụng phổ biến trên thế giới.

Abstract: When Vietnamese education and social scientists conduct research, they may or may not use statistics, in part because they may not be fully aware of the importance and value that statistics can provide for their research. This paper discusses the meaning, value, and importance of statistics in educational and social science research. In addition to basic statistical concepts, we introduce some advanced statistical models that are beginning to be widely used around the world.
Xác suất thống kê là một cách mô tả thế giới, một cách tóm tắt những thông tin hoặc tri thức quá phức tạp mà không thể hiểu một cách trực tiếp. Chúng ta có thể bắt đầu với một ví dụ về bảng điểm của 10 học sinh lớp 12, được chọn một cách ngẫu nhiên từ một trường phổ thông ở Hà Nội1:


STT

Họ và tên

Giới tính

Điểm trung bình

Thang đo stress (max=30)

Thang đo động cơ (max=120)

1

Nguyễn Văn A

Nam

7.3

24

112

2

Trần Thị B

Nữ

8.1

23

105

3

Ngô Nguyên C

Nam

7.6

20

109

4

Trần Vân D

Nữ

6

19

117

5

Lê Thị E

Nữ

9.5

15

86

6

Đinh Thị F

Nữ

9

28

102

7

Phạm Quốc G

Nam

6.5

25

110

8

Nguyễn Mai H

Nữ

7.8

23

100

9

Mai Văn I

Nam

8.7

29

95

10

Hồ Đình K

Nam

5.1

17

115

Không cần dùng đến khoa học thống kê2, bạn vẫn có thể biết được ai được bao nhiêu điểm ở thang đo nào, xếp thứ bao nhiêu, nhưng không thể biết được những điều phức tạp hơn như ảnh hưởng của stress và động cơ học tập đối với kết quả học tập như thế nào.

Từng con số riêng lẻ sẽ không nói lên điều gì hoặc rất ít ý nghĩa. Với thang điểm 10, một điểm 9.5 của Lê Thị E có thể coi là rất cao, thực tế là điểm cao nhất lớp, với điểm Z9.5 = 1.4. Nhưng nếu điểm đó nằm trong phân bổ điểm bài kiểm tra môn X của lớp gồm mười học sinh như sau X={10,9.5,8.5,9.5,9.5,10,9.5,9,9.5,10}, lúc này điểm Z9.5 = 0, và cũng bằng điểm trung bình của cả lớp. Để đánh giá một học sinh, căn cứ vào điểm số chưa chắc đã phản ánh chính xác nhất, mà cần có sự so sánh đối chiếu trong tương quan với những học sinh khác trong cùng mẫu. Như vậy, bằng việc dùng những khái niệm đầu tiên và cơ bản nhất của xác suất thống kê như trung bình (mean), khoảng (range) và chỉ số Z (Z score), chúng ta có thể thấy nhiều hơn và sâu hơn ý nghĩa của từng điểm số hoặc điểm của từng cá nhân. Nhưng đây chỉ là so sánh tương quan điểm của cá nhân trong nhóm, hay là cùng một loại điểm. Ngoài ra, xác suất thống kê còn cho phép chúng ta xem mức độ liên quan giữa hai loại điểm, ví dụ như tương quan (correlation) giữa điểm môn X và điểm trung bình, hay tương quan giữa điểm trung bình và mức độ stress ở học sinh.

Tương quan giữa điểm trung bình và môn X là -0.137. Chúng ta có thể nói rằng điểm trung bình có tương quan ngược với môn X. Nhưng kết quả thống kê của SPSS cho thấy con số này không có ý nghĩa đại diện cho toàn bộ dân cư (hay tổng thể thống kê). Vì vậy, trong trường hợp này, chúng ta không thể khái quát cho tất cả học sinh cùng học môn X… Từ đây chúng ta cũng có thể suy ra rằng điểm môn X không phản ánh được tốt kết quả học tập, vì những học sinh điểm cao ở môn X lại có điểm trung bình thấp, nhưng không hoàn toàn, vì tương quan rất thấp, hơn nữa lại không có ý nghĩa thống kê.

Lê Thị E có điểm trung bình cao nhất lớp nhưng điểm stress và động cơ đều thấp nhất. Nếu chúng ta khái quát tình hình cả lớp từ trường hợp học sinh này thì không phản ánh được tình hình lớp học, khiến chúng ta có cái nhìn sai lầm chủ quan. Lý do sẽ được bàn luận kĩ hơn dưới đây.

Tương quan giữa điểm trung bình (điểm càng cao thì học càng giỏi) và thang đo stress (điểm càng cao thì càng bị stress) là 0.301, ở mức độ trung bình, có nghĩa là học sinh điểm càng cao, kết quả học tập càng tốt thì stress càng cao nhưng không phải tất cả. Điều này nói lên rằng thang đo stress này có hiệu lực hoặc có ý nghĩa khi đo stress ở học sinh. Trong khi tương quan giữa điểm trung bình và thang đo động cơ lại là -0.872, là tương quan ngược ở mức độ rất cao. Ở đây có nhiều cách diễn giải, thứ nhất là thang đo động cơ tính điểm ngược, có nghĩa là điểm thang đo càng cao thì động cơ của cá nhân càng thấp. Khả năng thứ hai, đây là thang đo có vấn đề, không đo được cái cần đo vì động cơ học tập không thể ngược với kết quả học tập. Thứ ba, nếu đây là một thang đo đã được chứng minh tính tin cậy và hiệu lực thì quá trình làm trắc nghiệm có vấn đề, như hướng dẫn sai, người trả lời không trung thực… Trong trường hợp thang đo được tính điểm ngược, có nghĩa là điểm trung bình tương quan thuận 0.872 với thang đo động cơ, thì thang đo động cơ là một chỉ báo tốt cho kết quả học tập. Nói cách khác là học sinh nào có động cơ học tập càng cao thì kết quả học tập càng cao và ngược lại.



Xác suất thống kê là gì?

Khoa học thống kê là một lĩnh vực của khoa học toán học liên quan tới việc thu thập, phân tích và diễn giải hay giải thích và trình bày số liệu. Các nhà thống kê giúp cải thiện chất lượng của số liệu với việc thiết kế thực nghiệm và lấy mẫu nghiên cứu. Xác suất thống kê cũng cung cấp những công cụ để dự đoán và dự báo bằng việc sử dụng số liệu và các mô hình thống kê. Xác suất thống kê được ứng dụng vào nhiều lĩnh vực học thuật khác nhau, bao gồm khoa học tự nhiên và xã hội, quản lý của chính phủ và kinh doanh.

Các phương pháp thống kê có thể được sử dụng để tóm tắt hay mô tả tập hợp của số liệu, gọi là thống kê mô tả (descriptive statistics). Điều này rất hữu ích trong nghiên cứu, khi nhà nghiên cứu muốn phổ biến kết quả nghiên cứu hoặc thực nghiệm của họ. Hơn nữa, các mẫu trong số liệu có thể được mô hình hóa theo cách mà có thể kiểm soát được tính ngẫu nhiên và tính không chắc chắc trong quan sát, và sau đó được sử dụng để đưa ra các suy luận về quá trình hay về tổng thể (population) được nghiên cứu; cái này được gọi là thống kê suy luận (inferential statistics). Suy luận là không thể thiếu được trong khoa học khách quan vì nó mang lại những dự đoán (dựa trên số liệu) một cách lôgic. Nhằm xác định tính chính xác của những dự đoán này, những ước đoán này cũng được kiểm tra, là một phần của phương pháp khoa học.

Các nhà nghiên cứu giáo dục học và khoa học xã hội cần biết và sử dụng xác suất thống kê, nhưng họ không cần biết quá sâu về toán học. Vì hiện nay các chương trình phần mềm xác suất thống kê ngày càng phổ biến và mạnh mẽ (như SPSS, SAS và R), và các công thức tính đã được lập trình sẵn, thì yêu cầu về khả năng toán học không phải là chủ chốt. Nhưng những phần mềm này chỉ giúp được rất ít trong việc lên kế hoạch nghiên cứu, lựa chọn kỹ thuật phù hợp và diễn giải kết quả. Vì vậy, đối với các nhà giáo dục học, hiểu ý nghĩa của những thuật toán và mô hình thống kê khác nhau trong những khung cảnh khác nhau mới là điều quan trọng.



Xác suất thống kê trong nghiên cứu giáo dục học và các khoa học xã hội

Việc hiểu biết xác suất thống kê giúp nhà giáo dục hiểu được và đánh giá được chất lượng các bài nghiên cứu. Trong dạy học, điều này là quan trọng, khi các giáo viên áp dụng các thành tựu nghiên cứu mới vào công việc giảng dạy của mình. Một giáo viên giỏi sẽ biết đọc các nghiên cứu mới về phương các phương pháp sư phạm và ứng dụng những phương pháp mới trong tiết dạy học của mình. Thứ hai, họ có thể thực hiện được các nghiên cứu giáo dục học (Schuyten G., 1990).

Trong giáo dục học và các khoa học xã hội, nghiên cứu có vai trò rất quan trọng vì nó giúp con người nhìn nhận thế giới một cách khách quan. Con người luôn có xu hướng nhìn nhận mọi sự vật hiện tượng theo xu hướng chủ quan, theo cái nhìn của cá nhân mình. Xác suất thống kê giúp làm giảm tính chủ quan và tăng cường tính khách quan.

Xác suất thống kê giúp nhà nghiên cứu khái quát hóa ra cái chung, cái tổng quát. Vì mọi nghiên cứu xã hội đều có giới hạn về thời gian, tài chính, không gian, độ tin cậy nên hầu như không bao giờ có nghiên cứu nào có thể “vươn tới” mọi đối tượng cần nghiên cứu hay có thể đạt được độ chính xác tuyệt đối. Xác suất thống kê có các biện pháp dự đoán, dự báo toàn bộ nhóm đối tượng nào đó (ví dụ như học sinh phổ thông, giáo viên, sinh viên đại học) từ một mẫu nghiên cứu với số lượng nhất định (ví dụ như học sinh ở 3 trường phổ thông, giáo viên ở một phường, xã nào đó hoặc sinh viên bộ môn Toán, Lý, Hóa của Đại học Giáo dục).



Một số khái niệm hữu ích của xác suất thống kê được sử dụng thường xuyên trong nghiên cứu giáo dục và khoa học xã hội.

Xác suất (probability)

Giá trị p (p value)

Giả sử nhà nghiên cứu muốn tìm hiểu xem có sự khác biệt điểm trung bình môn toán giữa học sinh nam và học sinh nữ cấp III hay không. Trên toàn nước Việt Nam, có khoảng 3 triệu học sinh cấp III và kể cả có đủ kinh phí, thời gian, chúng ta cũng không thể nào tìm hiểu đo đạc được ở tất cả mọi học sinh. Vì sao? Tổng thể luôn thay đổi, dịch chuyển từng giờ từng phút. Ngày qua ngày, giờ qua giờ, luôn có học sinh bỏ học, nghỉ học, chuyển trường, thậm chí chuyển cấp, nên việc điều tra trên toàn bộ tổng thể hầu như không thể thực hiện.

Vì vậy, chúng ta cần mẫu để nghiên cứu. Từ tất cả học sinh cấp III Việt Nam, chúng ta sẽ lựa chọn ngẫu nhiên 100 học sinh nam, 100 học sinh nữ. Sau khi thu thập, phân tích, xử lý số liệu, chúng ta kết luận rằng học sinh nam có điểm trung bình môn toán cao hơn học sinh nữ. Và điểm trung bình môn toán của nam là 7.8 và của nữ là 7.0, chênh nhau 0.8. Tuy vậy, chúng ta không chỉ muốn kết luận cho mẫu học sinh mà chúng ta nghiên cứu, điều đó có rất ít ý nghĩa, chúng ta muốn kết luận cho toàn bộ học sinh cấp III Việt Nam. Lúc đó chúng ta cần sử dụng giá trị p (p value).

Giá trị p là khả năng mà, khi cho rằng không có sự khác nhau giữa điểm trung bình môn toán ở nam và nữ của tổng thể, nhà nghiên cứu sẽ tìm thấy độ khác biệt ở trong một mẫu nghiên cứu khác bất kì và sự khác biệt đó bằng hoặc lớn hơn độ khác biệt mà nhà nghiên cứu tìm thấy trong mẫu nghiên cứu của họ. Vì vậy nếu giá trị p = 0.12 khi so sánh điểm trung bình môn toán của nam và nữ thì chỉ có 12% số lần nhà nghiên cứu sẽ tìm thấy sự khác nhau bằng hoặc cao hơn 0.8 ở điểm số của nam và nữ. Nếu nghiên cứu này được làm đi làm lại 100 lần, lựa chọn 100 mẫu khác nhau, và tính điểm trung bình 100 lần, thì giá trị p nói lên rằng nếu thực sự không có sự khác biệt điểm môn toán giữa nam và nữ trong tổng thể, họ vẫn có thể tìm thấy điểm trung bình của nam cao hơn nữ bằng hoặc ít nhất 0.8 (là điểm họ tìm ra trong nghiên cứu) 12 trong số 100 lần, hay 12%. Giá trị p là khả năng mà kết luận của họ là sai. Như vậy, nếu giá trị p càng nhỏ thì nhà nghiên cứu càng có thể tự tin rằng kết quả nghiên cứu của mình là đúng. Các nhà khoa học trong lĩnh vực giáo dục học và các khoa học xã hội khác (tâm lý học, xã hội học,…) thống nhất rằng khi giá trị nhỏ hơn hoặc bằng 0.05, hay 5% thì chúng ta có đủ tự tin để nói rằng có sự khác nhau trong tổng thể nghiên cứu.



Cỡ tác dụng (effect size)3

Cỡ tác dụng là một khái niệm thống kê đo độ mạnh của mối quan hệ giữa hai biến. Ví dụ, nếu chúng ta thu thập số liệu về chiều cao của nam giới và nữ giới, chúng ta sẽ thấy rằng nói chung thì nam luôn cao hơn nữ. Sự khác nhau giữa chiều cao của nam và nữ được biết đến là cỡ tác dụng. Cỡ tác dụng càng lớn thì sự khác biệt chiều cao giữa nam và nữ càng lớn. Cỡ tác dụng giúp chúng ta xác định xem sự khác biệt đó có thật không hay chỉ là thay đổi các yếu tố.

Trong xác suất thống kê suy luận, cỡ tác dụng giúp chúng ta xác định xem liệu sự khác nhau có ý nghĩa thống kê có khác nhau trong khung cảnh thực tế nào đó không. Ví dụ, ở trường phổ thông A, điểm trung bình môn toán của học sinh nam cao hơn học sinh nữ là 0.8, cỡ tác dụng sẽ biết sự khác biệt đó có ý nghĩa thống kê hay không. Bởi trong các nghiên cứu bao gồm nhiều khách thể (mẫu nghiên cứu lớn), các test so sánh luôn cho thấy sự khác biệt giữa các nhóm. Cỡ tác dụng sẽ cho biết liệu sự khác nhau quan sát được đó có thực sự quan trọng hay không.

So sánh các giá trị trung bình


  1. T-test (Student’s t test)4

T-test được dùng để so sánh điểm trung bình của hai nhóm. Ví dụ nhà nghiên cứu muốn tìm hiểu xem phương pháp dạy học X và Y có hiệu quả khác nhau hay không. Sau khi bố trí một cách ngẫu nhiên (randomly) 50 học sinh lớp 11 học môn Hóa học theo phương pháp X và 50 học sinh lớp 11 học môn Hóa học theo phương pháp Y. Sau một số buổi dạy hoặc khi hết học kỳ, họ tổ chức đánh giá hiệu quả dạy học bằng cách cho hai nhóm học sinh làm cùng bài kiểm tra hoặc trắc nghiệm. Sau khi có được điểm trung bình của hai nhóm, nhà nghiên cứu sẽ dùng t-test để kiểm tra xem hai điểm trung bình của hai nhóm (với các điều kiện ban đầu như học lực, hứng thú là như nhau) có khác nhau một cách có ý nghĩa thống kê (statistical significant) hay không. Từ đó họ có thể suy ra hai phương pháp dạy học đó hiệu quả khác nhau không và cũng tìm ra phương pháp nào hiệu quả hơn.

  1. ANOVA F test

T-test dùng để tìm xem có sự khác biệt hay không giữa hai nhóm. Tuy vậy, nhiều khi nhà nghiên cứu lại muốn tìm hiểu xem có sự khác biệt hay không giữa ba hoặc hơn ba nhóm, ví dụ ba nhóm học sinh được dạy theo phương pháp X, Y và Z. Trong tình huống này, họ có thể dùng ba t-test để so sánh: X,Y – Y,Z và Z,X. Nhưng cách so sánh này không giúp đối chiếu cả ba phương pháp cùng một lúc hay cho biết phương pháp nào là hiệu quả nhất. Phân tích phương sai, hay ANOVA (viết tắt của analysis of variance) có thể giúp nhà nghiên cứu trả lời câu hỏi này.

ANOVA đặc biệt hữu ích trong so sánh các phương pháp học tập, dạy học khác nhau ở những khách thể khác nhau. Có nhiều mô hình ANOVA khác nhau tùy thuộc vào số lượng các phương pháp dạy và học và đối tượng nghiên cứu.



ANOVA một chiều (one-way ANOVA) được sử dụng để kiểm tra sự khác nhau giữa hai (hoặc nhiều hơn) nhóm độc lập. Thường thì người ta dùng ANOVA một chiều để so sánh sự khác nhau giữa ít nhất là ba nhóm, vì so sánh hai nhóm có thể được thực hiện bởi T-test (Gossett, 1908). Khi chỉ so sánh hai nhóm, T-test và F-test chỉ là một, khi đó mối liên hệ giữa ANOVA và t là F = t2. ANOVA giai thừa (factorial ANOVA) được sử dụng khi nhà nghiên cứu muốn tìm hiểu về hiệu quả của hai (hoặc nhiều hơn) phương pháp dạy học khác nhau. Hình thức thông dụng nhất của ANOVA giai thừa là 2x2, trong đó có hai biến độc lập và mỗi biến có hai mức độ giá trị phân biệt. ANOVA giai thừa cũng có thể ở đa cấp như 3x3, hoặc cao hơn như 2x2x2. Nhưng ANOVA ở các cấp cao như vậy khó có thể làm bằng tay bởi các phép tính rất dài và phức tạp. Nhưng do sự phổ biến của các phần mềm thống kê, việc sử dụng ANOVA trong nghiên cứu trở nên khá phổ biến và thông dụng.

Tương quan và hồi quy

Một chức năng cơ bản của thống kê mô tả là nhằm cung cấp chỉ số cho mối quan hệ giữa hai biến. Tương quan được dùng để mô tả mối quan hệ giữa các biến ngẫu nhiên. Chỉ số tuyến tính được sử dụng khi với biến ngẫu nhiên và biến được cố định bởi người nghiên cứu.



  1. Tương quan (correlation)

Trong xác suất thống kê, tương quan (thường được đo như là hệ số tương quan ρ) là chỉ số biểu diễn độ mạnh và chiều hướng của mối quan hệ tuyến tính giữa hai biến. Ví dụ như hai thang đo hay bảng hỏi, tương quan biểu diễn mức độ kết nối giữa chúng, trong phạm vi của điểm chuẩn (điểm số Z). Ví dụ, nếu tương quan giữa hai thang đo A và B là 0.6, có nghĩa là với 1 thay đổi trong độ lệch chuẩn (standard deviaton, viết tắt là SD) ở thang đo A, thì thang đo B thay đổi cùng chiều 0.6 trong độ lệch chuẩn.

Trong nghiên cứu không có tương quan “tốt” hay “xấu”, hay cả tương quan “cao” hay “thấp” cũng rất tương đối vì nó còn phụ thuộc vào khung cảnh và mục đích nghiên cứu. Hệ số tương quan là 0.9 có thể là rất thấp khi một người kiểm tra lại kích thước của một loại máy móc nào đó và dùng thước đo chính xác cao (đến mức độ micromet chẳng hạn). Nhưng 0.9 lại là rất cao trong nghiên cứu xã hội, vì có quá nhiều sai số từ những yếu tố phức tạp khác.

Cohen (1988) đề xuất diễn giải về độ lớn của hệ số tương quan như sau:


Hệ số tương quan

Tương quan nghịch (hệ số ρ < 0)

Tương quan thuận (hệ số ρ > 0)

Thấp

-0.3 đến -0.1

0.1 đến 0.3

Trung bình

-0.5 đến -0.3

0.3 đến 0.5

Cao

-1.0 đến -0.5

0.5 đến 1.0




  1. Hồi quy bội (multiple-regression)

Hồi quy bội là dạng mở rộng của mô hình hồi quy tuyến tính (linear regression) bao gồm hai biến (hoặc nhiều hơn) giải thích trong một hằng số dự đoán một biến kết quả. Hình hồi quy bội là một hướng cơ bản của phân tích thống kê ở hầu hết các lĩnh vực bởi nó rất mạnh và linh hoạt.

Các phân tích tuyến tính được sử dụng rộng rãi trong nghiên cứu. Nói chung, hồi quy tuyến tính cho phép nhà nghiên cứu có thể đặt câu hỏi (và trả lời) “Dự báo tốt nhất của yếu tố… là gì…?”. Một nhà tâm lý có thể quan tâm đến việc yếu tố nào của nhân cách dự đoán tốt nhất sự hòa nhập xã hội của họ. Một nhà xã hội học có thể muốn tìm hiểu tập hợp những chỉ số xã hội nào dự đoán liệu một nhóm người di cư có thể thích nghi vào môi trường xã hội mới. Trong giáo dục, cán bộ phụ trách tuyển sinh của một trường đại học có thể quan tâm tới việc lấy những tiêu chí nào để chọn được những ứng viên có khả năng hoàn thành chương trình học cao nhất. Khả năng hoàn thành chương trình học có thể được đại diện bằng điểm tổng kết (ĐTK) là một biến chưa có và cần được dự đoán. Những biến sẵn có và để dự đoán bao gồm điểm thi đại học (ĐTĐH), điểm trung bình của ba năm cấp III (ĐTBCIII), bản đánh giá về ý thức học tập trong học bạ (YTHT)… Hồi quy bội có thể giúp chúng ta dự đoán khả năng hoàn thành chương trình của ứng viên từ những chỉ số sẵn có. Một công thức tuyến tính đa chiều có thể được biểu diễn như sau:

ĐTK = β1(ĐTĐH) + β2(ĐTBCIII) + β3(YTHT)

Hoặc khái quát hơn: Y = β1X1 + β2X2 + β3X3

Giả sử trong trường hợp này, β1=0.2, β2 = 0.5 và β3=0.3, vì vậy: Y = 0.2X1 + 0.5X2 + 0.3X3

Vì chỉ số β1 nhỏ hơn chỉ số β2, cán bộ phụ trách đó có thể kết luận rằng, điểm trung bình ba năm cấp III là chỉ số dự đoán chính xác nhất cho khả năng hoàn thành khóa học, chứ không phải điểm thi đại học. β3 nhỏ hơn β2 nhưng lại lớn hơn β1, nên điểm trung bình cấp III và nhận xét của giáo viên về ý thức học tập là những yếu tố dự đoán quan trọng hơn điểm thi đại học, trong đó điểm trung bình cấp III là yếu tố dự đoán cao nhất.



  1. Mô hình đẳng thức cấu trúc (SEM)

Mô hình đẳng thức cấu trúc (Structural Equation Modeling, viết tắt là SEM) là một dạng phân tích thống kê cao cấp, trong đó dự đoán độ lớn và mức độ ý nghĩa thống kê của quan hệ nhân quả giữa các biến. Nhưng, hơn cả việc ước đoán mối quan hệ nhân quả giữa các biến trong số liệu thực sự được thu thập bởi nhà nghiên cứu, nó còn ước đoán mối quan hệ giữa các “biến ẩn”5. Để lấy ví dụ về tính hữu ích của SEM, chúng tôi xin trích một phần trong một nghiên cứu gần đây của chúng tôi [8], về mối liên hệ giữa việc bị bắt nạt, nhận thức và trầm cảm ở nạn nhân (xem biểu đồ 1).

Tất cả các số liệu nghiên cứu đều có sai số6 (được ký hiệu “e” trong biểu đồ 1). Trong đó, điểm của mỗi khách thể trả lời bảng nghiên cứu bị ảnh hưởng bởi các biến ẩn mà chúng ta quan tâm và những yếu tố khác không liên quan tới những biến ẩn này. Ví dụ, điểm của khách thể trên thang đo trầm cảm bị ảnh hưởng bởi mức độ bị trầm cảm của họ, nhưng cũng bị ảnh hưởng bởi các yếu tố khác như lúc trả lời bảng hỏi, họ có bị mệt không, có đói không, hay hôm đó họ có chuyện gì vui hay không, v.v.. Mục đích chủ đạo của SEM là loại bỏ những sai số này để điểm của khách thể chỉ bị ảnh hưởng bởi các biến ẩn mà chúng ta quan tâm. Để làm được điều này, chúng ta cần một số biến sẵn có để đánh giá cùng một biến ẩn.

Biểu đồ 1 biểu diễn SEM được thực hiện trong nghiên cứu của chúng tôi. Trong mô hình này, mỗi biến ẩn (được biểu diễn bằng vòng elip) có ba chỉ báo (được biểu diễn bằng hình chữ nhật) dựa vào số liệu mà chúng tôi thu thập. Ví dụ, biến ẩn Bị bắt nạt dựa trên ba câu hỏi lấy từ bảng hỏi về bắt nạt. Đường mũi tên từ các biến ẩn khác nhau thể hiện hiệu ứng (effect) của mỗi biến đến các biến khác, được thể hiện gần giống như tương quan. Ví dụ, hệ số từ nhận thức đến trầm cảm là 0.47, có nghĩa là hiệu ứng nhân quả trong mô hình này của nhận thức đối với trầm cảm là 0.47, tương đương với chỉ số tương quan. Có nghĩa là, đối với 1 điểm tăng lên (hay giảm xuống) của độ lệch chuẩn ở nhậnn thức thì 0.47 điểm tăng (hoặc giảm) của độ lệch chuẩn ở trầm cảm. Ở biểu đồ 1, biến ẩn đầu tiên là Bị bắt nạt có hiệu ứng nhân quả tới nhận thức và đối với trầm cảm. Nhận thức lại có hiệu ứng nhân quả đối với trầm cảm.

Biểu đồ 1 cho ta thấy, hầu hết hiệu ứng của bắt nạt đối với trầm cảm là thông qua hiệu ứng của nhận thức. Có nghĩa là, sự khác nhau giữa các chủ thể về mức độ bị bắt nạt mà họ trải nghiệm có liên quan tới sự khác nhau giữa các chủ thể về trầm cảm, nhưng hầu hết mối quan hệ đó là do sự khác nhau về nhận thức của các chủ thể. Đường mũi tên trực tiếp từ bắt nạt tới trầm cảm trong mô hình SEM (biểu đồ 1) mà không thông qua nhận thức, là rất nhỏ (0.18). Nhưng nếu chúng ta nhìn nhận mối quan hệ này một cách gián tiếp, bắt nạt ảnh hưởng tới nhận thức, và nhận thức ảnh hưởng tới trầm cảm, và có rất ít hiệu ứng giữa bắt nạt và trầm cảm. Điều này rất quan trọng đối với các cán bộ tâm lý trong trường học và cán bộ tham vấn học đường, bởi nếu họ muốn phòng tránh hay điều trị trầm cảm ở những học sinh bị bắt nạt, thì can thiệp nhằm thay đổi nhận thức là việc nhất thiết phải làm.

Điểm mạnh của SEM là nó mang lại một mô hình toàn diện, chỉ ra các mối quan hệ nhân quả. SEM chỉ ra một cách rõ ràng và chính xác những mối quan hệ khác nhau và phức tạp giữa các biến cùng một lúc. Một ưu điểm khác của SEM là nó có thể khống chế sai số của thang đo trong các bảng hỏi, và đánh giá mối liên hệ giữa các biến ẩn (không có sai số) hơn việc đánh giá các liên hệ giữa biến sẵn có (luôn có sai số). Chỉ số tương quan trong SEM thường cao hơn trong tương quan đơn thuần vì các lỗi đã được loại bỏ. Vì vậy, SEM có thể đo đạc chính xác hơn mối quan hệ giữa các thang đo (các biến ẩn) bằng cách loại bỏ sai số ra khỏi các biến sẵn có.

Tài liệu tham khảo:

1. Trần Ngọc Phác, Trần Thị Kim Thu. Giáo trình lý thuyết thống kê. Nhà xuất bản thống kê – Trường đại học kinh tế quốc dân. Hà nội – 2006.

2. Nguyễn Cao Văn, Trần Thái Ninh. Giáo trình lý thuyết xác suất và thống kê toán. Nhà xuất bản đại học kinh tế quốc dân. 2008

3. Đào Hữu Hồ. Xác suất thống kê. In lần thứ mười. Nhà xuất bản đại học Quốc gia Hà nội. 2007.

4. Schuyten G. Statistical thinking in psychology and education. ICOTS 3, 1990.

5. Chow, S. L. (2002). Statistical and its role in psychological research. In Methods in Psychological Research, In Encyclopedia of Life Support Systems (EOLSS), Eolss Publishers, Oxford, UK.

6. Downie N. M., Heath R. W. Basic statistical methods. Second edition. Harper & Row Publishers. 1965.

7. Glass & Hopkins. (1996) Statistical Methods in Education and Psychology, 3rd edition

8. Trần Văn Công, Bahr Weiss, David Cole (2009). Bị bắt nạt bởi bạn cùng lứa và mối liên hệ tới nhận thức bản thân và trầm cảm ở học sinh phổ thông.

----------------------------------------------



Về tác giả:

1. Trần Văn Công: Hiện đang công tác tại Khoa Các khoa học Giáo dục, Đại học Giáo dục, Đại học Quốc gia Hà nội. Nghiên cứu sinh tâm lý học lâm sàng tại đại học Vanderbilt, Hoa Kỳ. Email: tranvancong@gmail.com



2. Bahr Weiss: Phó giáo sư, Tiến sĩ tâm lý lâm sàng, Khoa Tâm lý học và phát triển nguồn nhân lực, Đại học Giáo dục Peabody, Đại học Vanderbilt, Hoa Kỳ; giảng viên thỉnh giảng Đại học Giáo dục, Đại học Quốc gia Hà Nội. Email: bahr.weiss@vanderbilt.edu

1 Số lượng khách thể tối thiểu để thực hiện xác suất thống kê thường lớn hơn rất nhiều. Đây là một ví dụ được lập nên để minh họa.

2 Tiếng Anh là statistics, chúng tôi dịch là “khoa học thống kê” hoặc “xác suất thống kê”, cùng chỉ statistics

3 Tác giả mong nhận được sự góp ý của bạn đọc về việc chuyển ngữ

4 T-test được giới thiệu vào năm 1908 bởi William Sealy Gosset, một nhà hóa học làm việc cho nhà máy bia Guinness ở Dublin, Aixlen (“Student” là bút danh của ông). Ông đã phải sử dụng bút danh student để đặt tên cho khám phá của mình, do yêu cầu về bí mật kinh doanh ở công ty mà ông làm việc cho.

5 Biến ẩn (latent variable) là loại biến không xuất hiện sẵn trong thang đo mà được suy luận ra từ các biến sẵn có (manifest variable).

6 Error, viết tắt là e




tải về 113.98 Kb.

Chia sẻ với bạn bè của bạn:




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương