Kiểm định giả thuyết được biết đến là một suy luận trong thống kê, được biểu diễn bằng các đặc điểm của số học và đại diện bởi các tham số cụ thế nào đó. Theo đó nên ta thấy việc tìm hiểu về các tham số cực kì quan trọng để hiểu đặc điểm của tổng thể. Vậy kiểm định giả thuyết là gì? Đưa ra nhận định bằng kiểm định giả thuyết như thế nào?
Mục lục bài viết
1. Kiểm định giả thuyết là gì?
Kiểm định giả thuyết trong tiếng Anh là Hypothesis testing.
Trên thực tế chắc hẳn thuật ngữ kiểm định giả thuyết đã không còn xa lạ với chúng ta đay được hiểu là quá trình thiết lập và sử dụng các tiêu chuẩn thống kê để hỗ trợ cho việc đi đến quyết định về giá trị của giả thuyết trong điều kiện bất định. Trong những quyết định như thế, người ta có thể may mắn lựa chọn đúng, nhưng cũng có thể vấp phải rủi ro, tức lựa chọn sai lầm.
Căn cứ dựa trên lí thuyết này thì quá trình kiểm định giả thuyết có liên quan đến việc đánh giá những điều thuận lợi này và đưa ra các tiêu chuẩn cho phép tối thiểu hóa khả năng đi đến quyết định sai lầm.
2. Đưa ra nhận định bằng kiểm định giả thuyết:
Giả sử như nếu ta muốn đi đến nhận định rằng qui mô công ty có mối liên hệ tương quan chặt chẽ với thù lao trả cho hội đồng quản trị và hình thành một giả thuyết là doanh nghiệp càng lớn, mức thù lao bình quân trả cho hội đồng quản trị càng cao. Giả thuyết này có thể đúng hoặc sai, có thể được chấp nhận hay từ bỏ.
Theo đó nên nếu với giả thuyết đúng và chúng ta chấp nhận hoặc giả thuyết sai và chúng ta từ bỏ nó, thì như vậy chúng ta đã quyết định đúng. Bên cạnh đó, nếu từ bỏ giả thuyết khi nó cần được chấp nhận, chúng ta đã vấp phải sai lầm loại I. Còn nếu chấp nhận giả thuyết khi cần phải từ bỏ nó, chúng ta đã vấp phải sai lầm loại II.
Như vậy nên họ có thể giảm đi các loại rủi ro dẫn tới những sai lầm như thế trong quá trình kiểm định giả thuyết bằng cách sử dụng số liệu mẫu hiện có. Như vậy để có thể tránh và có thể giảm đi các rủi ro vấp phải sai lầm loại II và thiết lập các xác suất rõ ràng cho rủi ro vấp phải sai lầm loại I, người ta phải thận trọng trong quá trình hình thành giả thuyết. Nó thường sẽ liên quan đến sự hình thành giả thuyết 0, một giả thuyết giả định cái đối lập hoàn toàn với cái mà chúng ta muốn chứng minh.
3. Hình thành giả thuyết 0:
Chúng ta có thể hình thành giả thuyết 0 là mức thù lao bình quân của hội đồng quản trị là như nhau ở các xí nghiệp lớn và nhỏ và việc từ bỏ giả thuyết này tương đương với sự chấp nhận giả thuyết ngược lại. Giả thuyết 0 sau đó có thể được kiểm định bằng số liệu mẫu.
Nếu các mẫu lặp lại được rút ra từ tổng thể các doanh nghiệp, thì phân phối mẫu có thể gần bằng phân phối chuẩn – một phân phối có thể được dùng để đánh giá xác suất dẫn tới sai số loại I. Mức xác suất sử dụng được gọi là mức ý nghĩa mà tại đó kiểm định ý nghĩa của giả thuyết 0 được thực hiện. Thông thường mức ý nghĩa được chọn bằng 0,01; 0,05 hoặc 0,1.
Mức ý nghĩa luôn luôn được xác định trước khi tiến hành kiểm định. Đối với các mẫu lớn, mức ý nghĩa bị qui định bởi phân phối xác suất của phân phối chuẩn. Đối với các mẫu nhỏ, mức ý nghĩa được xác định trên cơ sở phân phối t hay còn gọi là phân phối Student.
Bước cuối cùng là kiểm định ý nghĩa. Mức thù lao bình quân của hội đồng quản trị được tính từ số liệu mẫu cho các doanh nghiệp nhỏ và lớn, sau đó đem so sánh với mức thù lao dự kiến của hội đồng quản trị mà theo giả định của giả thuyết 0 do chúng ta đưa ra là bằng nhau ở các công ty lớn và nhỏ. Nếu mức chênh lệch giữa cái mà chúng ta muốn phát hiện – mức thu lao bình quân như nhau – và cái mà chúng ta nhận được nhỏ đến mức có thể gán cho tính ngẫu nhiên, thì kết quả thu được sẽ không có ý nghĩa về mặt thống kê.
Như vậy trường hợp đầu tiên chúng ta có thể loại bỏ trường hợp với giả thuyết 0 và đồng ý với hình ảnh ngược với nó là thù lao của hội đồng quản trị trong các doanh nghiệp lớn hơn thì lớn hơn còn trong trường hợp thứ hai, chúng ta không có ý kiến về vấn đề qui mô công ty và thù lao của hội đồng quản trị, vì không có mối liên hệ rõ ràng nào được chứng minh hay bác bỏ.
Như vậy nếu dựa trên phương pháp thống kê để kiểm định giả thuyết thường được sử dụng rộng rãi trong các công trình nghiên cứu kinh tế ứng dụng.
Để chúng ta hiểu hơn có thể xem xét ví dụ về việc kiểm định giả thuyết trong nghiên cứu. Vơi bất kì mẫu ô tô nào đạt được những thành tích nhất định như gần đây đã đạt được mức năng lượng trung bình là 24 dặm/gallon. Nhóm nghiên cứu sản phẩm đã phát triển một hệ thống bơm năng lượng mới đặc biệt thiết kể để tăng số dặm trên mỗi gallon. Để đánh giá hệ thống mới này, một vài chiếc sẽ được sản xuất, cài đặt trong ô tô hiện tại, và thực hiện cuộc kiểm tra có kiểm soát vì mục đích nghiên cứu.
Theo như ví dụ này thì nhóm nghiên cứu sản phẩm phải tiến hành tìm bằng chứng để đưa kết luận liệu hệ thống mới có làm tăng giá trị trung bình giá dặm mỗi gallon. Trong trường hợp này, giả thuyết nghiên cứu là hệ thống phun nhiên liệu mới này sẽ vượt mức trung bình 24 dặm mỗi gallon vượt 24. Giả thuyết được giả sử luôn đúng gọi là H0 (Null Hypothesis).
Theo đó ta thấy tồn tại như một quy ước chung, một giả thuyết nghiên cứu được nêu sẽ là giả thuyết thay thế (alternative hypothesis, thường kí hiệu H1). Do đó, các giả thuyết không phù hợp và thay thế cho giả thuyết nghiên cứu là:
H0: µ <= 24 ;H1: µ > 24.
Như vậy trường hợp đưa ra được kết quả của mẫu cho rằng H0 không thể bị reject, thì theo đó cá nhân tiến hành nghiên cứu không thể kết luận là hệ thống phun nhiên liệu mới thì tốt hơn. Bên cạnh đó kết quả khác nếu H0 bị reject, thì nhà nghiên cứu sẽ kết luận được H1 là đúng.
4. Quy trình kiểm định giả thuyết thống kê:
Dựa trên các thông tin chúng tôi đưa ra như trên thì hiện nay để có một cái nhìn tổng thế, chúng tôi sẽ đưa ra quy trình chung để kiểm định thống kê một cách chính xác nhất. Sau đó, chúng ta sẽ đi vào giải quyết từng phần/ khái niệm liên quan, kèm theo ví dụ để hiểu hơn về vấn đề này. Lưu ý là với cấu trúc của một kiểm định thống kê thì tương tự nhau trong mọi trường hợp cụ thể như sau:
Bước 1. Xác định giả thuyết H0, H1
Ở bước này chúng ta phải tiến hành xác định kết luận mình muốn đưa ra. Trường hợp này có thể coi đây là một bài toán sử dụng phép biện chứng. Để chứng minh giả thuyết H0 sai thì ban đầu, giả sử H0 đúng. Sau đó, cũng tại bước đầu tiên này thì đi tìm kiếm bằng chứng để chứng tỏ H0 sai, tức là bác bỏ giả thuyết H0. Nếu bằng chứng yếu, thì ta không thể bác bỏ H0.
Bước 2. Xác định thống kê kiểm định (test statistic) cần thực hiện
Bước thứ hai về thống kê kiểm định đây là bước rất quan trọng vì đây là cách giúp ta tìm các chi tiết để xem có thể bác bỏ giả thuyết H0 hay không. Bước này có thể coi là đưa ra phương pháp tìm bằng chứng. Tùy theo tham số cần kiểm định ta sẽ lựa chọn thống kê kiểm định phù hợp. Một số thống kê kiểm định thường dùng là thống kê z, t, và Chi bình phương.
Ví dụ, bài toán kiểm định giá trị trung bình của tổng thể thì sẽ sử dụng thống kê z. Nếu tổng thế phân phối chuẩn, hoặc cỡ mẫu lớn, thì phân phối mẫu của giá trị trung bình của mẫu sẽ là chuẩn. Do đó, thông kế z (chuẩn hóa) được sử dụng.
Bước 3. Lấy mẫu, xác định giá trị điểm kiểm định (test score) từ mẫu
Lấy mẫu và tính toán giá trị kiểm định là đi tìm bằng chứng thực tế.
Bước 4. Lựa chọn phép đo đối với giá trị điểm kiểm định: P-value hay giá trị tới hạn (critical value)
Tại bước thứ tư này chúng ta nên cẩn thận khi chọn mẫu, đo đạc mẫu và thu thập được giá trị điểm kiểm định, làm sao ta biết điểm kiểm định này có là bằng chứng mạnh hay yếu để bác bỏ H0? Để biết được điều đó, ta cần một giá trị để đối chiếu. Ta sẽ sử dụng p-value hoặc giá trị tới hạn.
P-value là mức ý nghĩa nhỏ nhất để ta bác bỏ giả thuyết H0. Trong khi đó, giá trị tới hạn là mức ý nghĩa mà ta muốn bác bỏ H0, tức là ranh giới giữa miền chấp nhận (acceptance region) và miền bác bỏ (rejection region).
Bước 5. Đưa ra kết luận là bác bỏ hay không thể bác bỏ H0