Định lý giới hạn trung tâm trong thống kê nói rằng, với kích thước mẫu đủ lớn, phân phối lấy mẫu của giá trị trung bình cho một biến sẽ gần đúng với phân phối chuẩn bất kể phân phối của biến đó trong tổng thể. Vậy định luật giới hạn trung tâm là gì? Nội dung định luật trong tài chính như thế nào?
Mục lục bài viết
1. Định luật giới hạn trung tâm là gì?
Trong lý thuyết xác suất, định luật giới hạn trung tâm (CLT) phát biểu rằng phân phối của một biến mẫu xấp xỉ với phân phối chuẩn (tức là “đường cong hình chuông”) khi kích thước mẫu trở nên lớn hơn, giả sử rằng tất cả các mẫu đều có kích thước giống nhau và không phân biệt của hình dạng phân bố thực tế của dân cư.
Định lý là một khái niệm quan trọng trong lý thuyết xác suất vì nó ngụ ý rằng các phương pháp xác suất và thống kê làm việc cho phân phối chuẩn có thể áp dụng cho nhiều bài toán liên quan đến các loại phân phối khác. Định lý này đã có nhiều thay đổi trong quá trình phát triển chính thức của lý thuyết xác suất. Các phiên bản trước của định lý có từ năm 1811, nhưng ở dạng tổng quát hiện đại của nó, kết quả cơ bản này trong lý thuyết xác suất đã được phát biểu chính xác vào cuối năm 1920, do đó đóng vai trò là cầu nối giữa lý thuyết xác suất cổ điển và hiện đại.
Nói một cách khác, định luật giới hạn trung tâm là một tiền đề thống kê, với kích thước mẫu đủ lớn từ một tổng thể có mức phương sai hữu hạn, giá trị trung bình của tất cả các biến được lấy mẫu từ cùng một tổng thể sẽ xấp xỉ bằng giá trị trung bình của toàn bộ tổng thể. Hơn nữa, các mẫu này gần đúng với phân phối chuẩn, với phương sai của chúng xấp xỉ bằng phương sai của tổng thể khi kích thước mẫu lớn hơn, theo quy luật số lớn. Mặc dù khái niệm này được Abraham de Moivre phát triển lần đầu tiên vào năm 1733, nhưng nó mới được chính thức hóa cho đến năm 1930, khi nhà toán học người Hungary George Polya lưu ý đã đặt tên cho nó là Định lý Giới hạn Trung tâm.
2. Đặc điểm định luật giới hạn trung tâm:
Định luật giới hạn trung tâm (CLT) phát biểu rằng phân phối của mẫu có nghĩa là gần đúng với phân phối chuẩn khi kích thước mẫu lớn hơn, bất kể phân bố của tổng thể là bao nhiêu. Cỡ mẫu bằng hoặc lớn hơn 30 thường được coi là đủ để định luật giới hạn trung tâm chứa. Một khía cạnh chính của định luật giới hạn trung tâm là giá trị trung bình của mẫu có nghĩa là và độ lệch chuẩn sẽ bằng giá trị trung bình của tổng thể và độ lệch chuẩn. Cỡ mẫu đủ lớn có thể dự đoán các đặc điểm của quần thể chính xác hơn.
Ví dụ, giả sử rằng một mẫu thu được chứa nhiều quan sát, mỗi quan sát được tạo ngẫu nhiên theo cách không phụ thuộc vào giá trị của các quan sát khác và trung bình cộng của các giá trị quan sát được tính toán. Nếu quy trình này được thực hiện nhiều lần, định lý giới hạn trung tâm nói rằng phân phối xác suất của giá trị trung bình sẽ gần đúng với phân phối chuẩn. Một ví dụ đơn giản về điều này là nếu một người tung đồng xu nhiều lần, xác suất nhận được một số đầu cho trước sẽ đạt đến phân phối chuẩn, với giá trị trung bình bằng một nửa tổng số lần tung. Ở giới hạn của số lần lật vô hạn, nó sẽ bằng một phân phối chuẩn.
Định lý giới hạn trung tâm có một số biến thể. Ở dạng chung của nó, các biến ngẫu nhiên phải được phân phối giống nhau. Trong các biến thể, sự hội tụ của giá trị trung bình thành phân phối chuẩn cũng xảy ra đối với các phân phối không giống nhau hoặc đối với các quan sát không độc lập, nếu chúng tuân thủ các điều kiện nhất định. Phiên bản sớm nhất của định lý này, rằng phân phối chuẩn có thể được sử dụng như một phép gần đúng cho phân phối nhị thức, là định lý de Moivre – Laplace.
3. Nội dung định luật trong tài chính:
Một phần của định nghĩa cho định lý giới hạn trung tâm nêu rõ, “bất kể phân bố của biến trong tổng thể là bao nhiêu.” Phần này là dễ dàng! Trong một tập hợp, các giá trị của một biến có thể tuân theo các phân phối xác suất khác nhau. Các phân bố này có thể từ bình thường, lệch trái, lệch phải và đồng nhất giữa các phân bố khác.
Phần này của định nghĩa đề cập đến việc phân phối các giá trị của biến trong tổng thể mà từ đó bạn lấy một mẫu ngẫu nhiên. Định lý giới hạn trung tâm áp dụng cho hầu hết các loại phân phối xác suất, nhưng vẫn có những ngoại lệ. Ví dụ, tổng thể phải có một phương sai hữu hạn. Hạn chế đó loại trừ phân phối Cauchy vì nó có phương sai vô hạn. Ngoài ra, định lý giới hạn trung tâm áp dụng cho các biến độc lập, phân phối giống nhau. Nói cách khác, giá trị của một quan sát không phụ thuộc vào giá trị của một quan sát khác. Và, phân phối của biến đó phải không đổi trên tất cả các phép đo.
Thông thường, bạn thực hiện một nghiên cứu một lần và bạn có thể tính giá trị trung bình của một mẫu đó. Bây giờ, hãy tưởng tượng rằng bạn lặp lại nghiên cứu nhiều lần và thu thập cùng một cỡ mẫu cho mỗi lần. Sau đó, bạn tính giá trị trung bình cho từng mẫu này và vẽ biểu đồ trên biểu đồ. Biểu đồ hiển thị sự phân bố của các phương tiện mẫu, mà các nhà thống kê gọi là phân phối mẫu của giá trị trung bình. May mắn thay, chúng tôi không phải lặp lại các nghiên cứu nhiều lần để ước tính phân phối lấy mẫu của giá trị trung bình. Các thủ tục thống kê có thể ước tính điều đó từ một mẫu ngẫu nhiên duy nhất. Hình dạng của phân bố lấy mẫu phụ thuộc vào cỡ mẫu. Nếu bạn thực hiện nghiên cứu bằng cách sử dụng cùng một quy trình và chỉ thay đổi cỡ mẫu, thì hình dạng của phân bố lấy mẫu sẽ khác nhau đối với từng cỡ mẫu.
Hình dạng của phân bố lấy mẫu thay đổi theo cỡ mẫu. Và, định nghĩa của định lý giới hạn trung tâm nói rằng khi bạn có cỡ mẫu đủ lớn, phân phối lấy mẫu bắt đầu gần đúng với phân phối chuẩn. Cỡ mẫu phải lớn đến mức nào để sự gần đúng đó xảy ra? Nó phụ thuộc vào hình dạng của sự phân bố của biến số trong tổng thể cơ bản. Phân bố dân số càng khác với bình thường thì cỡ mẫu càng phải lớn. Thông thường, các nhà thống kê nói rằng cỡ mẫu 30 là đủ cho hầu hết các phân phối. Tuy nhiên, các phân phối bị lệch mạnh có thể yêu cầu cỡ mẫu lớn hơn.
Theo định lý giới hạn trung tâm, giá trị trung bình của một mẫu dữ liệu sẽ gần với giá trị trung bình của tổng thể được đề cập, khi kích thước mẫu tăng lên, bất chấp sự phân phối thực tế của dữ liệu. Nói cách khác, dữ liệu là chính xác cho dù phân phối là bình thường hay sai.
Theo nguyên tắc chung, kích thước mẫu khoảng 30-50 được coi là đủ để CLT giữ lại, 3 có nghĩa là phân phối của mẫu có nghĩa là phân phối khá bình thường. Do đó, người ta lấy càng nhiều mẫu, thì kết quả vẽ đồ thị càng có dạng phân phối chuẩn.
Tuy nhiên, lưu ý rằng lý thuyết giới hạn trung tâm vẫn sẽ gần đúng trong nhiều trường hợp đối với các cỡ mẫu nhỏ hơn nhiều, chẳng hạn như n = 8 hoặc n = 5,3 Định lý giới hạn trung tâm thường được sử dụng cùng với định luật số lớn, trong đó nói rằng giá trị trung bình của mẫu có nghĩa và độ lệch chuẩn sẽ gần bằng giá trị trung bình tổng thể và độ lệch chuẩn khi kích thước mẫu tăng lên, điều này cực kỳ hữu ích trong dự đoán chính xác các đặc điểm của quần thể.
Định luật giới hạn trung tâm hữu ích khi kiểm tra lợi nhuận của một cổ phiếu riêng lẻ hoặc các chỉ số rộng hơn, bởi vì việc phân tích rất đơn giản, do việc tạo ra các dữ liệu tài chính cần thiết tương đối dễ dàng. Do đó, các nhà đầu tư thuộc mọi loại dựa vào CLT để phân tích lợi nhuận cổ phiếu, xây dựng danh mục đầu tư và quản lý rủi ro.
Ví dụ, giả sử một nhà đầu tư muốn phân tích lợi nhuận tổng thể cho một chỉ số chứng khoán bao gồm 1.000 cổ phiếu. Trong trường hợp này, nhà đầu tư đó có thể chỉ cần nghiên cứu một mẫu cổ phiếu ngẫu nhiên để thu được lợi nhuận ước tính của chỉ số tổng. Để an toàn, hãy sử dụng ít nhất 30-50 cổ phiếu được lựa chọn ngẫu nhiên trên các lĩnh vực khác nhau, nên được lấy mẫu cho định lý giới hạn trung tâm để nắm giữ. Hơn nữa, các cổ phiếu đã chọn trước đó phải được hoán đổi với các tên khác nhau để giúp loại bỏ sự thiên vị.