Các giả định trong phân tích tương quan tuyến tính

This entry is part 6 of 18 in the series Tương quan giữa hai biến định lượng

Cập nhật: 13/08/2021 bởi admin0

Giả định số 1: Hai biến xét tương quan được đo lường trên thang đo liên tục (tức là chúng được đo lường ở mức khoảng hoặc mức tỷ lệ ).

Giả định số 2: Hai biến liên tục đó phải bắt cặp, có nghĩa là mỗi quan sát (ví dụ: mỗi đáp viên) thì phải có hai giá trị tương ứng cho mỗi biến

Giả định số 3: Cần có một mối quan hệ tuyến tính giữa hai biến. Cách tốt nhất để kiểm tra giả định này là vẽ biểu đồ phân tán và kiểm tra biểu đồ một cách trực quan.

Giả định số 4: Không được có các giá trị ngoại lai đáng kể (quá khác biết) . Các điểm khác biệt là các điểm dữ liệu trong mẫu của bạn không tuân theo một mẫu tương tự với các điểm dữ liệu khác. Hệ số tương quan Pearson rất nhạy cảm với các giá trị ngoại lệ, có nghĩa là các giá trị ngoại lệ có thể có ảnh hưởng quá mức đến giá trị của r . Điều này có thể dẫn đến hệ số tương quan của Pearson không có giá trị đại diện tốt nhất cho toàn bộ dữ liệu. Do đó, tốt nhất là không có ngoại lệ hoặc cố gắng hạn chế điều này.

Xem cách kiểm tra giả đinh 3 và 4 ở đây: https://ungdung.hotronghiencuu.com/chuan-doan-quan-he-tuyen-tinh-cua-2-bien-bang-bieu-do-phan-tan

Giả định số 5: Nếu bạn muốn chạy thống kê suy luận (kiểm định ý nghĩa giả thuyết vô hiệu), bạn cũng cần phải đáp ứng giả định về tính phân phối chuẩn hai biến . Cách thực hiện xem ở đây: https://ungdung.hotronghiencuu.com/tag/kiem-tra-tinh-phan-phoi-chuan-cua-mot-bien-ngau-nhien

Bình luận chung

+ Giả định 1 phụ thuộc và việc thiết kế và thu thập dữ liệu

+ Giả định 2 có thể bỏ qua, khi phần mềm chạy sẽ chỉ xét các quan sát đầy đủ giả trị ở cả cặp. Tuy nhiên để mẫu đầy đủ tính đại diện và tránh lãng phí hãy cố gắng hạn chế điều này

+ Giả định 3 mình thấy đa số các bài đều bỏ qua (cho đơn giản) nhưng cũng có thể gây ra sai lầm nếu chúng không phụ thuộc nhau với dạng hàm bậc nhất

+ Giả định 4 thường bị bỏ qua

+ Giả định 5 thường bị bỏ qua. Tất nhiên nếu dữ liệu không phân phối chuẩn thì sẽ có kiểm định phù hợp hơn.

Tóm lại mình thấy nếu các bạn làm luận văn thông thường thì không cần xem xét gì giả định, cứ chạy thẳng tương quan và phân tích như bình thường là được.

Nếu bỏ qua các giả định số 3 và 4 thì các bạn bỏ qua luôn bài viết ngay liền sau bài viết này trong seri nhé!!!!

 

Series Navigation<< Tương quan tuyến tính và hệ số tương quan PearsonChuẩn đoán quan hệ tuyến tính của 2 biến bằng biểu đồ phân tán >>