Phân phối đa thức là gì? Đặc điểm và ví dụ thực tế về phân phối đa thức? Công thức phân phối đa thức?
Hiện nay trong doanh nghiệp để có thể tính toán được thu nhập tốt hơn so với các doanh nghiệp khác và để ước tính các xác xuất xảy ra người ta thường dùng phân phối đa thức để có thể tính toán một cách chính xác nhất.
Mục lục bài viết
1. Phân phối đa thức là gì?
Phân phối đa thức trong tiếng Anh là Multinomial Distribution.
Khi nhắc tới phân phối đa thức chúng ta hiểu đây là dạng phân phối xác suất được sử dụng trong tính toán kết quả các thử nghiệm liên quan đến từ hai biến trở lên. Phân phối nhị thức là một loại phân phối đa thức đặc biệt được biết đến rộng rãi, phân phối nhị thức chỉ có hai kết quả có thể xảy ra, ví dụ như đúng và sai hoặc ngửa và sấp cụ thể khi tung đồng xu. Trong tài chính, các nhà phân tích sử dụng phân phối đa thức để ước tính xác suất xảy ra của một tập hợp kết quả nhất định. Chẳng hạn như khả năng một công ty sẽ có thu nhập tốt hơn dự kiến trong khi các đối thủ cạnh tranh của họ có thu nhập không như dự kiến.
2. Đặc điểm và ví dụ thực tế về phân phối đa thức:
Khi chúng ta muốn vận dụng lí thuyết của phân phối đa thức trong thống kê và tổng quát của phân phối nhị thức chỉ thừa nhận hai giá trị chẳng hạn như thành công và thất bại cho nhiều hơn hai giá trị và cũng giống như phân phối nhị thức, phân phối đa thức là một hàm phân phối cho các quá trình rời rạc trong đó xác suất cố định chiếm ưu thế cho mỗi giá trị được tạo độc lập. Tuy nhiên với các quy trình liên quan đến phân phối đa thức có thể được nghiên cứu bằng cách sử dụng phân phối nhị thức bằng cách tập trung vào một kết quả quan tâm và kết hợp tất cả các kết quả khác thành một loại đơn giản hóa phân phối thành hai giá trị, phân phối đa thức hữu ích hơn khi tất cả các kết quả là quan tâm.
Phân phối đa thức có thể áp dụng cho các thử nghiệm thỏa mãn các điều kiện về thử nghiệm cụ thể đây là các lần thử được lặp đi lặp lại, ví dụ như gieo xúc xắc 100 lần thay vì chỉ một lần và ngoài ra còn các thử nghiệm phải diễn ra độc lập với nhau. Ví dụ: nếu tung cùng lúc hai con xúc xắc, kết quả của con xúc xắc này sẽ không ảnh hưởng đến kết quả của con xúc xắc kia, xác suất của mỗi kết quả phải giống nhau trong từng lần thử.
Ví dụ: con xúc xắc có sáu mặt thì mỗi lần xoay con xúc xắc, các kết quả phải có 1/6 khả năng xuất hiện và theo mỗi lần thử phải cho ra một kết quả cụ thể, chẳng hạn như khi lăn hai con xúc xắc sáu mặt, kết quả sẽ là một số từ 2 đến 12.
Ví dụ thực tế về Phân phối đa thức như sau:
Trong bối cảnh đầu tư, một nhà quản lí danh mục đầu tư hoặc nhà phân tích tài chính có thể sử dụng phân phối đa thức để ước tính xác suất giả sử như sau:
– (a) Khả năng một chỉ số vốn hóa nhỏ có lợi nhuận vượt trội hơn so với chỉ số vốn hóa lớn 70% thời gian quan sát.
– (b) Khả năng một chỉ số vốn hóa lớn có lợi nhuận vượt trội hơn chỉ số vốn hóa nhỏ 25% thời gian quan sát.
– (c) Khả năng cả hai chỉ số vốn hóa lớn và vốn hóa nhỏ có cùng (hoặc gần đúng) lợi nhuận 5% thời gian quan sát.
Trong ví dụ này, thời gian thử nghiệm có thể diễn ra trong vòng một năm giao dịch, sử dụng dữ liệu từ thị trường để đánh giá kết quả. Nếu xác suất của tập hợp các kết quả trên đủ cao, nhà đầu tư có thể sẽ thiên về đầu tư quá mức vào chỉ số vốn hóa nhỏ.
3. Công thức phân phối đa thức:
Là phân phối tổng quát hoá của phân phối nhị thức, giả sử ta có n phép thử độc lập và mỗi phép thử sẽ cho kết quả thành là một trong số k nhóm với mỗi nhóm có xác suất tương ứng xác định và khi đó, phân phối đa thức sẽ mô hình hoá phân phối xác suất của số lần thành công của sự kiện. Như vậy, khi (n=1,k=2) ta sẽ có phân phối Béc-nu-li, còn khi (n>1,k=2) ta có phân phối nhị thức.
Giả sử p_i,\text{for }i=\overline{1,k} là xác suất rơi vào nhóm i tương ứng trong k nhóm, ta có:\sum_{i=1}^kp_i=1
Nếu biến ngẫu nhiên X_i \in \{0,1,…,n\},\text{for }i=\overline{1,k} thể hiện số lần xuất hiện của sự kiện nhóm i, ta có:\sum_{i=1}^kx_i=n
Đặt X=[X_1,X_2,…,X_k]^{\intercal} là véc-to ngẫu nhiên với xác suất tương ứng p=[p_1,p_2,…,p_k]^{\intercal}. Khi đó, X tuân theo phân phối đa thức X \sim \mathcal{Mult}(n,p) với tham số n \in \mathbb N là số lần thành công và p \in \mathbb{R^k}, 0 \le p_i \le 1 là xác suất xuất tại mỗi phép thử, sẽ có các tính chất:
Định nghĩa | Giá trị |
---|---|
PMF – p(x) | \displaystyle\dbinom{n}{x}\prod_{i=1}^kp_i^{x_i} |
Kỳ vọng – E[X] | np |
Phương sai – Var(X) | np\otimes(1-p) |
Trong đó: \dbinom{n}{x}=\dfrac{n!}{\prod_{i=1}^kx_i!} gọi là hệ số đa thức. \otimes thể hiện phép nhân phần tử: Var(X_i)=np_i(1-p_i).
Như vậy chúng ta thấy rằng hội nhập kinh tế sâu rộng mang đến cho các doanh nghiệp nhiều cơ hội, song cũng không ít thách thức trong hoạt động kinh doanh và với sự cạnh tranh khốc liệt trên thương trường làm cho không ít doanh nghiệp phải điêu đứng, thua lỗ dẫn đến nguy cơ đối diện với phá sản, kéo theo nhiều hệ lụy cho bản thân doanh nghiệp, những đối tác liên quan và cho cả nền kinh tế. Vì vậy, việc phân tích rủi ro phá sản trong các doanh nghiệp có ý nghĩa vô cùng quan trọng. Bài viết giới thiệu phương pháp phân tích thống kê để ứng dụng trong phân tích rủi ro phá sản của doanh nghiệp.
Hiện nay cũng có một số mô hình khác chẳng hạn như mô hình mạng Neutral theo đó mục tiêu chính trong nghiên cứu mạng Neutral là đưa ra những mô hình có kết quả được tạo ra một cách tự động từ những quy luật hay kiểu mẫu dữ liệu với mạng Neutral có thể bắt chước và nhận thức được các trạng thái thực đối với dữ liệu đầu vào và không đầy đủ hoặc dữ liệu với một số lượng biến lớn. Kỹ thuật này đặc biệt với mô hình dự báo mà không có công thức toán học nào được biết để miêu tả mối quan hệ giữa các biến đầu vào và đầu ra và hơn nữa, phương pháp này hữu dụng khi mục tiêu dự báo là quan trọng hơn giải thích, một trong những thuận lợi của mô hình Neutral là nó có thể giải quyết mối quan hệ phi tuyến tính.
Kỹ thuật phân tích MDA có ưu điểm là xem xét cân nhắc toàn bộ tập hợp các đặc điểm chung của các công ty tương ứng, cũng như sự tương tác lẫn nhau của các đặc điểm này và trong khi đó, một nghiên cứu đơn biến chỉ có thể cân nhắc các công cụ đo lường được sử dụng cho nhóm chỉ định trước tại một thời điểm. Một ưu điểm khác của phân tích MDA là sự giảm phạm vi của các nhà phân tích, đó là, từ một số các biến độc lập khác nhau đến chỉ còn A-1 đại lượng, ở đó A bằng với số nhóm gốc.
MDA là một phương pháp thống kê được sử dụng để phân loại một quan sát nào đó vào một hay nhiều nhóm độc lập dựa vào những đặc thù riêng biệt của những quan sát với phương pháp này được sử dụng trước hết là để phân loại hoặc dự báo những vấn đề mà biến độc lập xuất hiện ở dạng định tính như phá sản hay không phá sản. Vì thế nên ở bước đầu tiên là phải xây dựng việc phân loại nhóm rõ ràng và sau khi các nhóm đã được thiết lập, dữ liệu phải được thu thập, MDA sẽ lọc ra, kết hợp tuyến tính của những đặc trưng này để phân biệt tốt nhất giữa các nhóm.
Nhiều nghiên cứu đã kết luận, mô hình ước lượng và dự báo dựa trên phương pháp mạng Neutral tốt hơn mô hình Logit và Probit, sau đó mới đến MDA và LPM do mô hình mạng Neutral đòi hỏi dữ liệu đầu vào lớn, đồng thời phương pháp này tương đối phức tạp và chưa phổ biến ở Việt Nam, nên nếu sử dụng phương pháp thống kê để phân tích rủi ro phá sản tại DN, các chuyên gia kinh tế khuyến cáo lựa chọn mô hình tốt thứ hai là hợp lý vì yêu cầu mẫu không quá cao, ít ràng buộc về mặt giả thiết và hiện đang được sử dụng rộng rãi trên thế giới.