Phân phối xác suất được hiểu cơ bản là phân phối tần suất lý thuyết biểu thị tần suất dự kiến để một biến cố cụ thể trung bình có thể xảy ra. Phân phối xác suất loga chuẩn? Tìm hiểu về phân phối chuẩn?
Phân phối xác suất chính là một khái niệm tích phân trong lý thuyết xác suất và thống kê. Phân phối xác suất hiện nay có tầm quan trọng lớn đối với các nhà khoa học dữ liệu tham vọng củng cố sự hiểu biết của các chủ thể về phân bố xác suất để nhằm mục đích có thể trở nên hiệu quả hơn. Chắc hẳn hiện nay vẫn còn nhiều người chưa hiểu rõ về thuật ngữ này.
Mục lục bài viết
1. Phân phối xác suất:
Ta hiểu về phân phối xác xuất như sau:
Phân phối xác suất được hiểu cơ bản là phân phối tần suất lý thuyết biểu thị tần suất dự kiến để một biến cố cụ thể trung bình có thể xảy ra.
Một phân phối xác suất hay thường gọi hơn là một hàm phân phối xác suất là quy luật cho biết cách gán mỗi xác suất cho mỗi khoảng giá trị của tập số thực, sao cho các tiên đề xác suất được thỏa mãn. Theo thuật ngữ kỹ thuật, một phân phối xác suất được hiểu là một độ đo xác suất (probability measure) mà miền xác định là đại số Borel trên tập số thực.
Một phân phối xác suất còn được hiểu là một trường hợp đặc biệt của một khái niệm tổng quát hơn về độ đo xác suất, đó là một hàm thỏa mãn các tiên đề xác suất của Kolmogorov cho các tập đo được của một không gian đo được.
Một số loại phân phối xác suất phổ biến hiện nay đó là:
– Các phân phối rời rạc:
+ Với biến ngẫu nhiên nhận hữu hạn giá trị:
Phân phối Bernoulli là phân phối của biên ngẫu nhiên X lấy giá trị 1 với xác suất p và giá trị 0 với xác suất q = 1 − p. Phân phối Rademacher được hiểu cơ bản là phân phối của biên ngẫu nhiên X lấy giá trị giá trị 1 với xác suất 1/2 và giá trị −1 với xác suất 1/2.
Phân phối nhị thức (binomial distribution) được hiểu cơ bản là phân phối của biên ngẫu nhiên X biểu diễn số lần thành công trong một dãy thí nghiệm độc lập, trong đó mỗi lần thử xác suất thành công là số p cố định.
+ Với biến ngẫu nhiên nhận vô hạn giá trị:
Phân phối Boltzmann, một phân phối rời rạc quan trọng trong vật lý học thống kê. Phân phối Boltzmann thực hiện mô tả xác suất của các mức năng lượng rời rạc của một hệ thống trong cân bằng nhiệt. Phân phối Boltzmann có một mô hình liên tục.
– Các phân phối liên tục:
Phân phối liên tục được hiểu là phân phối của các biến ngẫu nhiên lấy giá trị trên một khoảng bị chặn.
Phân phối Beta trên đoạn [0,1], phân phối đều được đánh giá là trường hợp đặc biệt, hữu dụng cho việc ước lượng các xác suất thành công.
Phân phối đều liên tục: Phân phối đều liên tục trên đoạn [a,b] được hiểu là phân phối của biên ngẫu nhiên X, trong đó X nhận giá trị trong các khoảng con hữu hạn độ dài bằng nhau với xác suất bằng nhau.Phân phối chữ nhật là một phân phối đều trên đoạn [-1/2,1/2].
2. Phân phối xác suất loga chuẩn:
Khái niệm phân phối xác suất loga chuẩn:
Phân phối xác suất loga chuẩn hay còn được gọi là phân phối log-normal.
Phân phối xác suất loga chuẩn có thể được chuyển hóa thành phân phối chuẩn và ngược lại bằng cách sử dụng các tính toán logarit liên quan.
Phân phối chuẩn được hiểu là phân phối xác suất của các kết quả đối xứng hoặc tạo thành một đường cong hình chuông. Trong một phân phối chuẩn, 68% kết quả nằm trong một độ lệch chuẩn và 95% nằm trong hai độ lệch chuẩn so với giá trị trung bình.
Đa số mọi người đều biết đến phân phối chuẩn tuy nhiên chắc hẳn thì phân phối xác suất loga chuẩn có thể là một khái niệm khá mới mẻ. Một phân phối chuẩn có thể được chuyển đổi thành phân phối xác suất loga chuẩn bằng các hàm toán học logarit. Các phân phối xác suất loga chuẩn chỉ có thể sử dụng khi chúng ta tập hợp các biến ngẫu nhiên có phân phối chuẩn.
Một vài lí do để nhằm mục đích sử dụng phân phối xác suất loga chuẩn song song với phân phối chuẩn là hầu hết các phân phối xác suất loga chuẩn là kết quả của việc lấy cơ số tự nhiên e = 2.718. Tuy nhiên, phân phối xác suất loga chuẩn cũng có thể thay đổi phạm vi bằng cách sử dụng một cơ sở khác có ảnh hưởng đến hình dạng của phân phối xác suất loga chuẩnl.
Nhìn chung lại, ta thấy rằng, phân phối xác suất loga chuẩn biểu diễn logarit của các biến ngẫu nhiên từ một phân phối chuẩn. Logarit được gọi là số mũ mà cơ số phải được mũ lên để tạo ra một biến ngẫu nhiên (x) có thể tìm thấy dọc theo đường cong của phân phối chuẩn.
Phân phối xác suất loga chuẩn trong tiếng Anh là gì?
Phân phối xác suất loga chuẩn hay phân phối log-normal trong tiếng Anh là Log-Normal Distribution.
Ứng dụng của phân phối xác suất loga chuẩn trong tài chính:
Phân phối chuẩn có một vài vấn đề mà phân phối xác suất loga chuẩn sx có thể giải quyết. Phân phối chuẩn cho phép các biến ngẫu nhiên có thể âm trong khi phân phối xác suất loga chuẩn có tất cả các biến đều dương.
Một trong những ứng dụng phổ biến nhất của phân phối xác suất loga chuẩn hiện nay đang được sử dụng trong tài chính là trong quá trình phân tích giá cổ phiếu. Lợi nhuận tiềm năng của một cổ phiếu có thể có phân phối chuẩn. Giá của cổ phiếu tuy nhiên có thể được vẽ thành biểu đồ của phân phối xác suất loga chuẩn. Đường cong phân phối xác suất loga chuẩn cũng có thể được sử dụng để nhằm mục đích có thể giúp xác định tốt hơn lợi nhuận gộp dự kiến mà cổ phiếu có thể đạt được trong một khoảng thời gian nhất định.
Lưu ý rằng phân phối xác suất loga chuẩn thông thường bị lệch với đuôi phải dài do giá trị trung bình thấp và phương sai cao trong các biến ngẫu nhiên.
Phân phối xác suất loga chuẩn trong Excel:
Phân phối xác suất loga chuẩn cũng có thể được thực hiện trong Excel. Cú pháp trong Excel như sau: LOGNORM.DIST (x, mean, standard_dev, cumulative)
Trả về phân phối xác suất loga chuẩn của x, trong đó ln(x) có phân phối chuẩn với các tham số giá trị trung bình mean và độ lệch chuẩn standard_dev.
3. Tìm hiểu về phân phối chuẩn:
Khái niệm phân phối chuẩn:
Phân phối chuẩn đang là loại phân phối phổ biến nhất hay được dùng giả định trong phân tích kĩ thuật thị trường chứng khoán và trong các loại phân tích thống kê khác.
Phân phối chuẩn thông thường có hai tham số cụ thể sau đây:
– Thứ nhất: giá trị trung bình.
– Thứ hai là độ lệch chuẩn.
Đối với phân phối chuẩn, 68% các quan sát nằm trong khoảng +/- độ lệch chuẩn của giá trị trung bình, 95% nằm trong +/- hai lần độ lệch chuẩn và 99,7% nằm trong + – ba lần độ lệch chuẩn.
Mô hình phân phối chuẩn đã được phát triển bởi Định luật giới hạn trung tâm. Lí thuyết này ra đời đã nói rằng các giá trị trung bình được tính toán từ các biến ngẫu nhiên độc lập và giống hệt nhau có phân phối gần với phân phối chuẩn, bất kể loại phân phối của mẫu mà các biến được lấy ra (miễn là nó có phương sai hữu hạn).
Phân phối chuẩn đôi khi bị nhầm lẫn với phân phối đối xứng. Phân phối đối xứng được hiểu cơ bản là một phân phối trong đó một đường phân chia sẽ tạo ra hai hình ảnh phản chiếu, nhưng dữ liệu thực tế có thể có hai bướu hoặc nhiều điểm nhô lên trên đường cong hình chuông của phân phối chuẩn.
Phân phối chuẩn còn được gọi là phân phối Gaussian trong tiếng Anh là gì?
Phân phối chuẩn còn được gọi là phân phối Gaussian trong tiếng Anh là Normal Distribution.
Độ lệch và độ nhọn:
Dữ liệu thực tế cũng rất hiếm khi theo một phân phối chuẩn hoàn toàn. Các hệ số độ lệch và độ nhọn thực hiện việc đo lường mức độ khác biệt của một phân phối nhất định so với phân phối chuẩn. Độ lệch đo lường tính đối xứng của một phân phối. Phân phối chuẩn là đối xứng và có độ lệch bằng không. Nếu phân phối của tập dữ liệu có độ lệch nhỏ hơn 0 hoặc độ lệch âm, thì đuôi bên trái của phân phối dài hơn đuôi bên phải; độ lệch dương ngụ ý rằng đuôi bên phải của phân phối dài hơn đuôi bên trái.
Độ nhọn đo độ dày của đuôi phân phối so với đuôi của phân phối chuẩn. Phân phối với đuôi lớn thể hiện dữ liệu ở đuôi phân phối vượt quá dữ liệu ở đuôi phân phối chuẩn. Các phân phối có độ nhọn thấp cho thấy tập dữ liệu có điểm cực trị thấp hơn các bản phân phối chuẩn.
Phân phối chuẩn có độ nhọn bằng ba, điều này cho thấy phân phối không có đuôi mập hay mỏng. Chính bởi vì thế, nếu một phân phối quan sát được có độ nhọn lớn hơn ba, phân phối được cho là có đuôi mập khi so sánh với phân phối chuẩn. Nếu phân phối có độ nhọn nhỏ hơn ba, nó sẽ được cho là có đuôi mỏng khi so sánh với phân phối chuẩn.
Phân phối chuẩn trong tài chính:
Cụ thể như phân phối chuẩn được áp dụng cho giá tài sản cũng như hành động giá. Các chủ thể là những nhà giao dịch có thể vẽ các điểm giá theo thời gian để nhằm mục đích phù hợp với hành động giá gần đây thành một phân phối chuẩn. Hành động giá càng di chuyển xa giá trị trung bình, càng có nhiều khả năng một tài sản bị định giá quá cao hoặc quá thấp. Các chủ thể là những nhà giao dịch có thể sử dụng độ lệch chuẩn để xem xét các giao dịch tiềm năng.
Cũng giống như vậy có nhiều lí thuyết thống kê cố gắng mô hình hóa giá tài sản theo giả định rằng chúng tuân theo phân phối chuẩn. Trong thực tế, phân phối giá có xu hướng có đuôi mập, và chính vì thế, chúng có độ nhọn lớn hơn ba. Các tài sản như vậy cũng có biến động giá lớn hơn ba độ lệch chuẩn, vượt quá mức giá trị trung bình với tần suất thường xuyên hơn dự kiến theo giả định phân phối chuẩn. Ngay cả khi một tài sản đã tồn tại một thời gian dài và phù hợp với phân phối chuẩn thì trên thực tế vẫn không có gì đảm bảo rằng hiệu suất trong quá khứ thực sự dự báo chính xác cho tăng trưởng trong tương lai.