Trong kiểm định ý nghĩa giả thuyết vô hiệu, giá trị P là xác suất thu được kết quả kiểm định ít nhất là cực trị so với kết quả thực tế quan sát được, với giả thiết rằng giả thuyết vô hiệu là đúng. Vậy phương pháp kiểm định trị số P là gì? Đặc điểm và giá trị p-value như thế nào?
Mục lục bài viết
1. Phương pháp kiểm định trị số P là gì?
– Trong thống kê, giá trị p là xác suất thu được kết quả ít nhất là cực trị với kết quả quan sát được của một phép thử giả thuyết thống kê, giả sử rằng giả thuyết rỗng là đúng. Giá trị p được sử dụng thay thế cho các điểm bác bỏ để cung cấp mức ý nghĩa nhỏ nhất mà tại đó giả thuyết vô hiệu sẽ bị bác bỏ. Giá trị p nhỏ hơn có nghĩa là có bằng chứng chắc chắn hơn ủng hộ giả thuyết thay thế.
– Giá trị p là một hàm của thống kê thử nghiệm đã chọn và do đó là một biến ngẫu nhiên. Nếu giả thuyết rỗng sẽ sửa chữa phân phối xác suất của chính xác, và nếu phân phối đó là liên tục, thì khi giả thuyết null là đúng, giá trị p được phân phối đồng đều giữa 0 và 1. Do đó, giá trị p không cố định. Nếu cùng một phép thử được lặp lại độc lập với dữ liệu mới (luôn có cùng phân phối xác suất), một phép thử sẽ nhận được giá trị p khác nhau trong mỗi lần lặp. Nếu giả thuyết rỗng là tổng hợp hoặc phân phối của thống kê là rời rạc, xác suất nhận được giá trị p nhỏ hơn hoặc bằng bất kỳ số nào trong khoảng từ 0 đến 1 nhỏ hơn hoặc bằng số đó, nếu giả thuyết rỗng là đúng. Vẫn còn trường hợp rằng các giá trị rất nhỏ tương đối khó xảy ra nếu giả thuyết rỗng là đúng và kiểm định ý nghĩa ở mức thu được bằng cách bác bỏ giả thuyết vô hiệu nếu mức ý nghĩa nhỏ hơn hoặc bằng .
– Trong thống kê, mọi phỏng đoán liên quan đến phân phối xác suất chưa biết của tập hợp các biến ngẫu nhiên đại diện cho dữ liệu quan sát trong một số nghiên cứu được gọi là giả thuyết thống kê . Theo định nghĩa, giả thuyết thống kê của chúng tôi sẽ nêu một số thuộc tính của phân phối, giả thuyết rỗng là giả thuyết mặc định mà theo đó thuộc tính đó không tồn tại. Giả thuyết rỗng thường là một số tham số (chẳng hạn như mối tương quan hoặc sự khác biệt giữa các phương tiện) trong các quần thể quan tâm bằng không. Lưu ý rằng giả thuyết của chúng tôi có thể chỉ định phân phối xác suất của chính xác, hoặc nó có thể chỉ xác định rằng nó thuộc về một số loại phân phối. Thông thường, chúng tôi giảm dữ liệu thành một thống kê số, ví dụ:, có phân phối xác suất cận biên có liên quan chặt chẽ đến một câu hỏi chính được quan tâm trong nghiên cứu.
2. Đặc điểm p- value:
– Giá trị p được sử dụng trong bối cảnh kiểm định giả thuyết rỗng để xác định ý nghĩa thống kê của một kết quả, kết quả là giá trị quan sát của thống kê đã chọn. Giá trị p càng thấp thì xác suất nhận được kết quả đó càng thấp nếu giả thuyết vô hiệu là đúng. Một kết quả được cho là có ý nghĩa thống kê nếu nó cho phép chúng ta bác bỏ giả thuyết vô hiệu. Tất cả những thứ khác bằng nhau, giá trị p nhỏ hơn được coi là bằng chứng mạnh mẽ hơn chống lại giả thuyết vô hiệu.
– Phương pháp tiếp cận giá trị p để kiểm tra giả thuyết sử dụng xác suất được tính toán để xác định liệu có bằng chứng để bác bỏ giả thuyết không. Giả thuyết vô hiệu, còn được gọi là phỏng đoán, là khẳng định ban đầu về một tập hợp (hoặc quá trình tạo dữ liệu). Giả thuyết thay thế cho biết liệu tham số dân số có khác với giá trị của tham số dân số được nêu trong giả thuyết hay không.
– Kiểm định giả thuyết giá trị p không nhất thiết phải sử dụng mức độ tin cậy đã chọn trước mà tại đó nhà đầu tư nên đặt lại giả thuyết rỗng rằng lợi nhuận là tương đương. Thay vào đó, nó cung cấp một thước đo xem có bao nhiêu bằng chứng để bác bỏ giả thuyết vô hiệu. Giá trị p càng nhỏ thì bằng chứng chống lại giả thuyết vô hiệu càng lớn. Do đó, nếu nhà đầu tư nhận thấy rằng giá trị p là 0,001 thì có bằng chứng chắc chắn chống lại giả thuyết vô hiệu và nhà đầu tư có thể tự tin kết luận lợi nhuận của danh mục đầu tư và lợi nhuận của S&P 500 là không tương đương.
– Mặc dù điều này không cung cấp một ngưỡng chính xác về thời điểm nhà đầu tư nên chấp nhận hoặc từ chối giả thuyết vô hiệu, nhưng nó có một lợi thế rất thực tế khác. Thử nghiệm giả thuyết giá trị P cung cấp một cách trực tiếp để so sánh mức độ tin cậy tương đối mà nhà đầu tư có thể có khi lựa chọn giữa nhiều loại đầu tư hoặc danh mục đầu tư khác nhau, liên quan đến điểm chuẩn như S&P 500.
– Ví dụ về P-Value: Một nhà đầu tư tuyên bố rằng hiệu suất danh mục đầu tư của họ tương đương với Chỉ số Standard & Poor’s (S&P) 500 . Để xác định điều này, chủ đầu tư tiến hành kiểm tra hai đầu. Giả thuyết vô hiệu cho biết lợi nhuận của danh mục đầu tư tương đương với lợi nhuận của S&P 500 trong một khoảng thời gian cụ thể, trong khi giả thuyết thay thế nói rằng lợi nhuận của danh mục đầu tư và lợi nhuận của S&P 500 không tương đương – nếu nhà đầu tư tiến hành thử nghiệm một bên, thì phương án thay thế giả thuyết sẽ cho biết rằng lợi nhuận của danh mục đầu tư nhỏ hơn hoặc lớn hơn lợi nhuận của S&P 500.
– Kiểm định giả thuyết giá trị p không nhất thiết phải sử dụng mức độ tin cậy đã chọn trước mà tại đó nhà đầu tư nên đặt lại giả thuyết rỗng rằng lợi nhuận là tương đương. Thay vào đó, nó cung cấp một thước đo xem có bao nhiêu bằng chứng để bác bỏ giả thuyết vô hiệu. Giá trị p càng nhỏ thì bằng chứng chống lại giả thuyết vô hiệu càng lớn. Do đó, nếu nhà đầu tư nhận thấy rằng giá trị p là 0,001 thì có bằng chứng chắc chắn chống lại giả thuyết vô hiệu và nhà đầu tư có thể tự tin kết luận lợi nhuận của danh mục đầu tư và lợi nhuận của S&P 500 là không tương đương.
– Mặc dù điều này không cung cấp một ngưỡng chính xác về thời điểm nhà đầu tư nên chấp nhận hoặc từ chối giả thuyết vô hiệu, nhưng nó có một lợi thế rất thực tế khác. Thử nghiệm giả thuyết giá trị P cung cấp một cách trực tiếp để so sánh mức độ tin cậy tương đối mà nhà đầu tư có thể có khi lựa chọn giữa nhiều loại đầu tư hoặc danh mục đầu tư khác nhau, liên quan đến điểm chuẩn như S&P 500.
3. Giá trị p- value:
– Giá trị p thường được tìm thấy bằng bảng giá trị p hoặc bảng tính / phần mềm thống kê. Các tính toán này dựa trên phân phối xác suất giả định hoặc đã biết của thống kê cụ thể đang được kiểm tra. Giá trị p được tính toán từ độ lệch giữa giá trị quan sát và giá trị tham chiếu đã chọn, dựa trên phân phối xác suất của thống kê, với sự khác biệt lớn hơn giữa hai giá trị tương ứng với giá trị p thấp hơn.
– Về mặt toán học, giá trị p được tính bằng phép tính tích phân từ diện tích dưới đường cong phân phối xác suất cho tất cả các giá trị thống kê ít nhất là xa giá trị tham chiếu như giá trị quan sát được, so với tổng diện tích dưới đường cong phân phối xác suất . Tóm lại, sự khác biệt giữa hai giá trị quan sát càng lớn thì càng ít có khả năng sự khác biệt là do cơ hội ngẫu nhiên đơn giản và điều này được phản ánh bằng giá trị p thấp hơn.
– Phương pháp tiếp cận giá trị P để kiểm tra giả thuyết: Trong thực tế, mức ý nghĩa được nêu trước để xác định giá trị p phải nhỏ như thế nào để bác bỏ giả thuyết vô hiệu. Bởi vì các nhà nghiên cứu khác nhau sử dụng các mức ý nghĩa khác nhau khi kiểm tra một câu hỏi, người đọc đôi khi có thể gặp khó khăn khi so sánh kết quả từ hai bài kiểm tra khác nhau. Giá trị P cung cấp một giải pháp cho vấn đề này.
– Ví dụ, giả sử một nghiên cứu so sánh lợi nhuận từ hai tài sản cụ thể được thực hiện bởi các nhà nghiên cứu khác nhau, những người sử dụng cùng một dữ liệu nhưng mức ý nghĩa khác nhau. Các nhà nghiên cứu có thể đưa ra kết luận ngược lại về việc liệu các tài sản có khác nhau hay không. Nếu một nhà nghiên cứu sử dụng mức độ tin cậy là 90% và người kia yêu cầu mức độ tin cậy là 95% để bác bỏ giả thuyết vô hiệu và giá trị p của sự khác biệt quan sát được giữa hai kết quả là 0,08 (tương ứng với mức độ tin cậy là 92%) , thì nhà nghiên cứu đầu tiên sẽ thấy rằng hai tài sản có sự khác biệt có ý nghĩa thống kê , trong khi nhà nghiên cứu thứ hai sẽ không tìm thấy sự khác biệt có ý nghĩa thống kê giữa lợi nhuận.
Ví dụ: đối với hai danh mục đầu tư, A và B, có hiệu suất khác với S&P 500 với giá trị p tương ứng là 0,10 và 0,01, nhà đầu tư có thể tự tin hơn nhiều rằng danh mục đầu tư B, với giá trị p thấp hơn, sẽ thực sự hiển thị kết quả liên tục khác nhau.
Trong kiểm định ý nghĩa giả thuyết vô hiệu , giá trị P là xác suất thu được kết quả kiểm định ít nhất là cực trị so với kết quả thực tế quan sát được , với giả thiết rằng giả thuyết vô hiệu là đúng. Một giá trị P rất nhỏ có nghĩa là một kết quả được quan sát cực đoan như vậy sẽ rất khó xảy ra theo giả thuyết vô hiệu. Báo cáo giá trị P của các bài kiểm tra thống kê là thông lệ phổ biến trong các ấn phẩm học thuật của nhiều lĩnh vực định lượng.