Xác suất hậu nghiệm là xác suất được sửa đổi hoặc cập nhật của một sự kiện xảy ra sau khi xem xét thông tin mới. Xác suất sau được tính bằng cách cập nhật xác suất trước bằng cách sử dụng định lý Bayes. Công thức tính Xác suất hậu nghiệm?
Xác suất hậu nghiệm là thuật ngữ theo thống kê của Bayes, đây là xác suất trái ngược với xác suất tiên nghiệm. Xác suất hậu nghiệm có khá nhiều ưu điểm và tính ứng dụng cũng khá điển hình. Việc tìm hiểm về xác suất hậu nghiệm từ đó mà cũng mang rất nhiều ý nghĩa quan trọng.
Mục lục bài viết
1. Xác suất hậu nghiệm là gì?
Xác suất hậu nghiệm, trong thống kê Bayes, là xác suất được sửa đổi hoặc cập nhật của một sự kiện xảy ra sau khi xem xét thông tin mới. Xác suất sau được tính bằng cách cập nhật xác suất trước bằng cách sử dụng định lý Bayes. Theo thuật ngữ thống kê, xác suất hậu là xác suất của sự kiện A xảy ra cho rằng sự kiện B đã xảy ra.
Hay nói cách khác, Xác suất hậu nghiệm là một trong những đại lượng liên quan đến quy tắc Bayes. Nó là xác suất có điều kiện của một sự kiện nhất định, được tính sau khi quan sát sự kiện thứ hai mà xác suất có điều kiện và xác suất không điều kiện đã được biết trước. Nó được tính bằng cách sửa lại xác suất trước, nghĩa là xác suất được gán cho sự kiện đầu tiên trước khi quan sát sự kiện thứ hai.
Sự khác nhau giữa xác suất tiên nghiệm và xác xuất hậu nghiệm: Nói một cách đơn giản, phần trước là những gì bạn tin tưởng về một số lượng tại một thời điểm cụ thể, và phần sau là niềm tin của bạn khi có thêm thông tin.
Cụ thể hơn, phần trước cho bạn biết khả năng tương đối của các giá trị khác nhau của một số đại lượng (một tham số) “trong trường hợp không có dữ liệu”. [Ở đây tôi sẽ khác Jack ở chỗ chỉ ra rằng có thể có các giá trị gốc “không đúng”, và các giá trị này không tích hợp với một số lượng hữu hạn, do đó không thể là phân phối xác suất thực tế. Sự đồng nhất trước trên dòng thực cho nhật ký của độ lệch chuẩn là một điều phổ biến trước đó.] Phần sau cho bạn biết cách bạn sẽ sửa đổi những niềm tin đó “khi có dữ liệu”. Cũng xin lưu ý rằng dữ liệu có thể tiếp tục đến, vì vậy bạn có thể ‘cập nhật’ dữ liệu trước của bạn trước cái sau, sau đó cập nhật phần sau của RẰNG cho một cái khác, v.v.
Cách kết nối chúng chính xác là định lý Bayes. Kinh tế lượng Bayes hiện đại là nghiên cứu về cách thức cập nhật này được thực hiện cho nhiều mô hình thống kê khác nhau, có điều kiện dựa trên nhiều loại dữ liệu khác nhau.
Ví dụ: Cho có hai bình, bình A có 5 bi đen và 10 bi đỏ và bình B có 10 bi đen và 5 bi đỏ. Bây giờ nếu một chiếc lọ được chọn ngẫu nhiên, xác suất để chiếc lọ A được chọn là 0,5. Đây là xác suất tiên nghiệm. Nếu chúng ta được cung cấp thêm một thông tin rằng một quả bóng được rút ngẫu nhiên từ chiếc bình đã chọn và quả bóng đó có màu đen, thì xác suất để chiếc bình được chọn là bình A là bao nhiêu? Xác suất hậu nghiệm tính đến thông tin bổ sung này và sửa đổi xác suất xuống từ 0,5 thành 0,333 theo định lý Bayes, bởi vì một quả bóng đen có khả năng xuất hiện từ bình B nhiều hơn bình A.
Định lý Bayes có thể được sử dụng trong nhiều ứng dụng, chẳng hạn như y học, tài chính và kinh tế. Trong tài chính, định lý Bayes có thể được sử dụng để cập nhật niềm tin trước đó khi thu được thông tin mới. Xác suất trước đại diện cho những gì được tin tưởng ban đầu trước khi bằng chứng mới được đưa ra và xác suất sau có tính đến thông tin mới này.
Phân phối xác suất sau phải phản ánh tốt hơn sự thật cơ bản của quá trình tạo dữ liệu so với xác suất trước vì phân bố sau bao gồm nhiều thông tin hơn. Xác suất hậu nghiệm sau đó có thể trở thành xác suất hậu nghiệm mới được cập nhật khi thông tin mới phát sinh và được đưa vào phân tích.
Quá trình lặp lại phép thử và tính toán lại xác suất tiền lãi là quá trình cơ bản cần quan tâm trong thống kê Bayes. Từ một nghiên cứu Bayesianperspective, chúng tôi bắt đầu với một số xác suất tiên nghiệm cho một số sự kiện và chúng tôi cập nhật xác suất tiên nghiệm này với thông tin mới để có được một xác suất hậu nghiệm. Sau đó, xác suất sau có thể được sử dụng như một xác suất tiên nghiệm trong phân tích tiếp theo. Theo quan điểm của Bayes, đây là một biện pháp thích hợp để tiến hành nghiên cứu khoa học: Chúng tôi tiếp tục thu thập dữ liệu để đánh giá-xác định một giả thuyết khoa học cụ thể; chúng ta không bắt đầu lại (ngu dốt) mỗi khi chúng ta cố gắng trả lời một giả thuyết, bởi vì nghiên cứu trước đó cung cấp thông tin tiên nghiệm liên quan đến giá trị của giả thuyết.
Người ta thường biểu thị xác suất hậu nghiệm thông qua bản đồ, từ đó, mới có thuật ngữ bản đồ xác suất hậu nghiệm: Bản đồ xác suất hậu nghiệm là hình ảnh của xác suất hoặc độ tin cậy mà một kích hoạt vượt quá một ngưỡng quy định, được đưa ra từ dữ liệu. Bản đồ xác suất hậu nghiệm (PPM) đại diện cho một sự thay thế bổ sung cho bản đồ tham số thống kê (SPM) được sử dụng để đưa ra các suy luận cổ điển. Tuy nhiên, một vấn đề quan trọng trong suy luận Bayes là đặc điểm kỹ thuật của các giá trị thích hợp. Vấn đề này có thể được giải quyết bằng cách sử dụng Bayes thực nghiệm, trong đó các phương sai trước đó được ước tính từ dữ liệu, dưới một số giả định đơn giản về dạng của chúng. Các Bayes theo kinh nghiệm yêu cầu một mô hình quan sát phân cấp, trong đó các cấp cao hơn có thể được coi là đưa ra các ràng buộc trước đối với các cấp thấp hơn.
2. Công thức tính Xác suất hậu nghiệm:
Công thức tính xác suất xảy ra sau của A khi B xảy ra: P(A∣B) = P(A∩B)/P(B) = [P(A)×P(B∣A)]/P(B)
Trong đó:
– A, B = Sự kiện.
– P (B∣A) = Xác suất xảy ra B cho rằng A là đúng.
– P (A) và P (B) = Xác suất của A xảy ra và B xảy ra độc lập với nhau.
Do đó, xác suất sau là phân phối kết quả, P (A | B).
Vì tác nhân chỉ có thể nhìn thế giới thông qua dữ liệu mà nó được cung cấp, điều quan trọng là nó có thể trích xuất các giả thuyết hợp lý từ dữ liệu đó và bất kỳ kiến thức nào trước đó. Với xác xuất hậu nghiệm, một tác nhân có thể xác định tính hợp lệ của giả thuyết của mình khi biết xác suất thể hiện khả năng dữ liệu được đưa ra cho giả thuyết của nó và tất cả các quan sát trước đó.
Xác suất hậu nghiệm (PP) là các phép đo độ tin cậy rằng một suy luận cụ thể là đúng, dựa trên dữ liệu và mô hình. Trong phát sinh loài, suy luận đó là nút phân đôi – các PP gần 1 hỗ trợ nút là rất có thể xảy ra. PP dưới 0,5 cho thấy có sự hỗ trợ yếu đối với nút đó là đúng, nhưng trong các cây đã xuất bản, các nút có PP <0,5 này không được hiển thị theo quy ước, mà thay vào đó được thu gọn thành một hình đa giác. Để vẽ một nút phân nhánh với PP nhỏ hơn 0,5 là một mâu thuẫn về mặt: bạn đang nói cả hai “nút này có thể là đúng” (nút) và “nút này có thể không đúng” (PP) đồng thời.
Tính “quan trọng” như thế nào là tùy thuộc vào bạn. Nếu bạn đang đưa ra kết luận về các kết quả bằng cách sử dụng thống kê Bayes, chúng hoàn toàn rất quan trọng, giống như giá trị p đối với các thống kê khác. Nếu bạn hoài nghi về phương pháp luận của Bayes, thay vào đó bạn có thể so sánh PP với các chiến dịch khởi động của các phương pháp khác, để đặt câu hỏi về cách tiếp cận hợp lý nhất, dựa trên câu hỏi nghiên cứu của bạn. Cho dù phân tích cú pháp, khả năng xảy ra tối đa hay Bayesian là “đủ” không thực sự là một câu hỏi đúng và phụ thuộc vào ngữ cảnh. Ví dụ: parsimony không được hỗ trợ như một phương pháp có ý nghĩa nếu bạn đang sử dụng thông tin trình tự di truyền, nhưng có thể phù hợp với dữ liệu hình thái phân loại.
Nếu một quy trình Bayes không hội tụ (như các tần số phân tách và các PP không nhất quán của bạn hiển thị), thì thường là do không có đủ tín hiệu trong dữ liệu của bạn. Bạn sẽ điều tra điều này bằng cách xem xét các PP trong hệ thống phát sinh loài chưa được giải quyết, cho dù đó là một nút đơn hay một đa bội chung. Thêm dữ liệu thường là một ý tưởng hay, cho dù thông qua nhiều loài / gen / OTU hơn. Hoặc bạn có thể suy ra phylogenies cho các tập hợp con của ma trận của bạn (ví dụ, đối với một số gen hoặc một số loài), để cố gắng xác định nguồn gốc của sự thiếu hội tụ. Hãy nhớ rằng tập dữ liệu của bạn không nợ bạn phát sinh loài. Và bất kỳ hệ thống phát sinh loài nào xuất hiện, ngay cả với PP cao, có thể bị sai lệch vì một số yếu tố. Nếu bất cứ điều gì, số liệu thống kê về độ tin cậy của tôi càng cao, thì tôi càng nghi ngờ rằng phương pháp suy luận là sai lệch.