Cân bằng Nash trong lý thuyết trò chơi được biết đến là một tình huống trong đó một người chơi sẽ tiếp tục với chiến lược đã chọn của họ, không có động cơ nào để đi chệch khỏi nó, sau khi xem xét chiến lược của đối thủ. Vậy cân bằng Nash được định nghĩa là gì?
Mục lục bài viết
1. Cân bằng Nash là gì?
Cân bằng Nash là một khái niệm trong lý thuyết trò chơi trong đó kết quả tối ưu của một trò chơi là nơi không có động cơ để đi chệch khỏi chiến lược ban đầu. Cụ thể hơn, cân bằng Nash là một khái niệm của lý thuyết trò chơi trong đó kết quả tối ưu của một trò chơi là kết quả mà người chơi không có động cơ để đi chệch khỏi chiến lược đã chọn của họ sau khi cân nhắc lựa chọn của đối thủ.
Nhìn chung, một cá nhân không thể nhận được lợi ích gia tăng nào từ việc thay đổi hành động, giả sử những người chơi khác không đổi trong chiến lược của họ. Một trò chơi có thể có nhiều cân bằng Nash hoặc không có.
Trong lý thuyết trò chơi, cân bằng Nash, được đặt theo tên của nhà toán học John Forbes Nash Jr., là cách phổ biến nhất để xác định lời giải của một trò chơi bất hợp tác liên quan đến hai hoặc nhiều người chơi. Ở trạng thái cân bằng Nash, mỗi người chơi được cho là biết các chiến lược cân bằng của những người chơi khác và không người chơi nào có được lợi ích bằng cách chỉ thay đổi chiến lược của riêng họ. Nguyên tắc cân bằng Nash có từ thời Cournot, người vào năm 1838 đã áp dụng nó cho các công ty cạnh tranh lựa chọn đầu ra.
Nếu mỗi người chơi đã chọn một chiến lược – một kế hoạch hành động dựa trên những gì đã xảy ra cho đến nay trong trò chơi – và không người chơi nào có thể tăng lợi nhuận dự kiến của họ bằng cách thay đổi chiến lược của họ trong khi những người chơi khác giữ nguyên của họ, thì tập hợp các lựa chọn chiến lược hiện tại tạo thành cân bằng Nash.
Cân bằng Nash là một định lý ra quyết định trong lý thuyết trò chơi nói rằng một người chơi có thể đạt được kết quả mong muốn bằng cách không đi chệch khỏi chiến lược ban đầu của họ.
Ở trạng thái cân bằng Nash, chiến lược của mỗi người chơi là tối ưu khi xem xét các quyết định của những người chơi khác. Mọi người chơi đều chiến thắng bởi vì mọi người đều đạt được kết quả mà họ mong muốn.
Tình thế tiến thoái lưỡng nan của các tù nhân là một ví dụ về lý thuyết trò chơi phổ biến và là một ví dụ thể hiện đầy đủ ảnh hưởng của cân bằng Nash.
Cân bằng Nash thường được thảo luận cùng với chiến lược thống trị, trong đó nói rằng chiến lược được lựa chọn của một tác nhân sẽ dẫn đến kết quả tốt hơn trong số tất cả các chiến lược có thể được sử dụng, bất kể chiến lược mà đối thủ sử dụng là gì.
Điểm cân bằng Nash không phải lúc nào cũng có nghĩa là chiến lược tối ưu nhất được chọn.
Cân bằng Nash rất quan trọng bởi vì nó giúp người chơi xác định mức thưởng tốt nhất trong một tình huống không chỉ dựa trên quyết định của họ mà còn dựa trên quyết định của các bên khác có liên quan. Cân bằng Nash có thể được sử dụng trong nhiều khía cạnh của cuộc sống, từ chiến lược kinh doanh đến việc bán nhà cho đến chiến tranh và khoa học xã hội. Không có một công thức cụ thể nào để tính điểm cân bằng Nash, nhưng thay vào đó, nó có thể được xác định bằng cách mô hình hóa các tình huống khác nhau trong một trò chơi nhất định để xác định lợi nhuận của từng chiến lược và chiến lược nào sẽ là chiến lược tối ưu để lựa chọn.
Điểm cân bằng Nash là một thành phần của lý thuyết trò chơi khẳng định rằng một người chơi sẽ tiếp tục với chiến lược đã chọn của họ trong khi biết chiến lược của đối thủ vì họ không có động cơ để thay đổi hướng đi. Cân bằng Nash có thể được áp dụng trong nhiều tình huống thực tế khác nhau để xác định mức lợi nhuận tốt nhất trong một kịch bản sẽ dựa trên quyết định của bạn cũng như quyết định của đối thủ.
2. Cân bằng Nash có tên trong tiếng Anh là gì?
Cân bằng Nash có tên trong tiếng Anh là: “Nash equilibrium”.
3. Ứng dụng trong thị trường độc quyền nhóm:
Cân bằng Nash được đặt theo tên người phát minh ra nó, John Nash, một nhà toán học người Mỹ. Nó được coi là một trong những khái niệm quan trọng nhất của lý thuyết trò chơi, nhằm xác định một cách toán học và logic các hành động mà người tham gia trò chơi phải thực hiện để đảm bảo kết quả tốt nhất cho chính họ.
Lý do tại sao cân bằng Nash được coi là một khái niệm quan trọng như vậy của lý thuyết trò chơi liên quan đến khả năng ứng dụng của nó. Cân bằng Nash có thể được kết hợp trong nhiều lĩnh vực, từ kinh tế học đến khoa học xã hội.
Để nhanh chóng tìm ra điểm cân bằng Nash hoặc xem nó có tồn tại hay không, hãy tiết lộ chiến lược của mỗi người chơi cho những người chơi khác. Nếu không ai thay đổi chiến lược của họ, thì cân bằng Nash được chứng minh.
Cân bằng Nash thường được so sánh cùng với chiến lược thống trị, cả hai đều là chiến lược của lý thuyết trò chơi. Cân bằng Nash nói rằng chiến lược tối ưu cho một tác nhân là giữ nguyên chiến lược ban đầu của họ trong khi biết chiến lược của đối thủ và tất cả những người chơi duy trì cùng một chiến lược, miễn là tất cả những người chơi khác không thay đổi chiến lược của họ.
Chiến lược ưu thế khẳng định rằng chiến lược được lựa chọn của một tác nhân sẽ dẫn đến kết quả tốt hơn trong số tất cả các chiến lược có thể được sử dụng, bất kể chiến lược mà đối thủ sử dụng là gì.
Tất cả các mô hình lý thuyết trò chơi chỉ hoạt động nếu những người chơi tham gia là “tác nhân hợp lý”, có nghĩa là họ mong muốn kết quả cụ thể, hoạt động để cố gắng chọn kết quả tối ưu nhất, kết hợp sự không chắc chắn trong quyết định của họ và thực tế trong các lựa chọn của họ.
Cả hai thuật ngữ đều tương tự nhưng hơi khác nhau. Điểm cân bằng Nash nói rằng không có gì thu được nếu bất kỳ người chơi nào thay đổi chiến lược của họ nếu tất cả những người chơi khác vẫn duy trì chiến lược của họ. Chiến lược thống trị khẳng định rằng một người chơi sẽ chọn một chiến lược dẫn đến kết quả tốt nhất bất kể chiến lược mà những người chơi khác đã chọn. Chiến lược thống trị có thể được đưa vào trạng thái cân bằng Nash trong khi trạng thái cân bằng Nash có thể không phải là chiến lược tốt nhất trong trò chơi.
Ví dụ về cân bằng Nash
Hãy tưởng tượng một trò chơi giữa Tom và Sam. Trong trò chơi đơn giản này, cả hai người chơi đều có thể chọn chiến lược A để nhận 1 đô la hoặc chiến lược B để mất 1 đô la. Về mặt logic, cả hai người chơi đều chọn chiến lược A và nhận được phần thưởng là 1 đô la.
Nếu bạn tiết lộ chiến lược của Sam cho Tom và ngược lại, bạn sẽ thấy rằng không có người chơi nào đi chệch hướng lựa chọn ban đầu. Biết được nước đi của người chơi khác có nghĩa là rất ít và không thay đổi hành vi của người chơi. Kết quả A thể hiện cân bằng Nash.
Lưu ý:
Tình huống tiến thoái lưỡng nan của tù nhân là một tình huống phổ biến được phân tích trong lý thuyết trò chơi có thể sử dụng cân bằng Nash. Trong trò chơi này, hai tên tội phạm bị bắt và mỗi tên bị biệt giam mà không có phương tiện liên lạc nào với kẻ còn lại. Các công tố viên không có bằng chứng để kết tội cặp đôi, vì vậy họ cho mỗi tù nhân cơ hội để phản bội người kia bằng cách làm chứng rằng người kia đã phạm tội hoặc hợp tác bằng cách giữ im lặng.
Nếu cả hai tù nhân đều phản bội nhau, mỗi người phải ngồi tù 5 năm. Nếu A phản bội B nhưng B vẫn im lặng, tù nhân A được trả tự do và tù nhân B phải chịu 10 năm tù hoặc ngược lại. Nếu mỗi người giữ im lặng, thì mỗi người chỉ phải chịu một năm tù.
Cân bằng Nash trong ví dụ này là để cả hai người chơi phản bội lẫn nhau. Mặc dù sự hợp tác lẫn nhau dẫn đến một kết quả tốt hơn nếu một tù nhân lựa chọn hợp tác lẫn nhau và người kia không hợp tác, nhưng kết quả của một tù nhân lại tồi tệ hơn.
4. Những hạn chế của Cân bằng Nash:
Hạn chế chính của cân bằng Nash là nó đòi hỏi một cá nhân phải biết chiến lược của đối thủ của họ. Cân bằng Nash chỉ có thể xảy ra nếu người chơi chọn tiếp tục với chiến lược hiện tại của họ nếu họ biết chiến lược của đối thủ.
Trong hầu hết các trường hợp, chẳng hạn như trong chiến tranh, cho dù đó là chiến tranh quân sự hay chiến tranh đấu thầu, một cá nhân hiếm khi biết chiến lược của đối thủ hoặc họ muốn kết quả ra sao. Không giống như chiến lược thống trị, điểm cân bằng Nash không phải lúc nào cũng dẫn đến kết quả tối ưu nhất, nó chỉ có nghĩa là một cá nhân chọn chiến lược tốt nhất dựa trên thông tin họ có.
Hơn nữa, trong nhiều trò chơi được chơi với cùng một đối thủ, cân bằng Nash không tính đến hành vi trong quá khứ, mà thường dự đoán hành vi trong tương lai.