แนวคิดผลเฉลย ของ ทฤษฎีเกม

แนวคิดผลเฉลย (solution concept) หมายถึงฟังก์ชันหรือวิธีการที่ระบุผลลัพธ์จากเกมแต่ละเกม โดยนิยามของแนวคิดผลเฉลยแต่ละชนิดจะเป็นไปตามเงื่อนไขบางประการ[8]

เกมแบบไม่ร่วมมือ

สมดุลแบบแนช

ดูบทความหลักที่: สมดุลแบบแนช

แนวคิดสมดุลแบบแนช (Nash equilibrium; เรียกตามชื่อของจอห์น แนช) เป็นแนวคิดผลเฉลยสำคัญของทฤษฎีเกมแบบไม่ร่วมมือ หลักสำคัญของแนวคิดนี้คือ ผู้เล่นแต่ละฝ่ายเลือกทางเลือกที่ดีสุดสำหรับตนเอง เมื่อพิจารณาถึงทางเลือกของผู้เล่นอื่นในจุดสมดุลนั้นๆ[10]:11 ผู้เล่นแต่ละฝ่ายจึงไม่สามารถได้ประโยชน์มากขึ้นด้วยการเปลี่ยนทางเลือกของตัวเองแต่เพียงฝ่ายเดียวได้ในจุดสมดุล

จากนิยามของเกมรูปแบบกลยุทธ์ข้างต้น หากกำหนดให้ s − i {\displaystyle s_{-i}} หมายถึงโพรไฟล์กลยุทธ์ของผู้เล่นทุกคนยกเว้นผู้เล่น i {\displaystyle i} โพรไฟล์กลยุทธ์ s {\displaystyle s} สามารถเขียนได้ในอีกรูปแบบหนึ่งเป็น ( s i , s − i ) {\displaystyle (s_{i},s_{-i})}

โพร์ไฟล์กลยุทธ์ s ∗ = ( s 1 ∗ , s 2 ∗ , … , s n ∗ ) {\displaystyle s^{*}=(s_{1}^{*},s_{2}^{*},\dots ,s_{n}^{*})} ถือว่าเป็นจุดสมดุลแบบแนช ถ้ากลยุทธ์ s i ∗ {\displaystyle s_{i}^{*}} ที่ผู้เล่น i {\displaystyle i} เลือก เป็นกลยุทธ์ที่ให้อรรถประโยชน์สูงสุดแก่ผู้เล่น i {\displaystyle i} เมื่อผู้เล่นคนอื่นๆ เลือกเล่นกลยุทธ์ที่ระบุใน s ∗ {\displaystyle s^{*}} กล่าวอีกทางหนึ่งคือ ผู้เล่นแต่ละคนในเกมไม่สามารถทำให้อรรถประโยชน์ของตัวเองสูงขึ้นด้วยการเลือกกลยุทธ์อื่นที่ไม่ใช่ s i ∗ {\displaystyle s_{i}^{*}} ตราบใดที่ผู้เล่นคนอื่นทุกคนเลือกกลยุทธ์ของตัวเองตามที่กำหนดในโพรไฟล์กลยุทธ์ s ∗ {\displaystyle s^{*}} เงื่อนไขนี้เขียนด้วยสัญลักษณ์ทางคณิตศาสตร์ได้ว่า[10]:11[5]:96

∀ i ∈ N , ∀ s i ′ ∈ S i : u i ( s ∗ ) ≥ u i ( s i ′ , s − i ∗ ) {\displaystyle \forall i\in N,\forall s_{i}'\in S_{i}:u_{i}(s^{*})\geq u_{i}(s_{i}',s_{-i}^{*})}

เกมบางเกมอาจไม่มีจุดสมดุลแบบแนชในกลยุทธ์แท้ ผลงานสำคัญของแนชคือการพิสูจน์ว่า เกมทุกเกมจะมีจุดสมดุลลักษณะนี้ในกลยุทธ์แบบผสมอย่างน้อยหนึ่งจุดเสมอ แนชพิสูจน์ทฤษฎีบทนี้โดยการใช้ทฤษฎีบทจุดตรึง[10]:29 แนวทางการพิสูจน์ด้วยทฤษฎีบทจุดตรึงนี้สามารถพิสูจน์ทฤษฎีบทที่มีนัยทั่วไปกว่าทฤษฎีบทของแนชว่า หากว่าเกมมีเซตกลยุทธ์เป็นเซตย่อยของปริภูมิแบบยุคลิดที่กระชับ คอนเวกซ์ และไม่เป็นเซตว่าง และฟังก์ชันอรรถประโยชน์ของผู้เล่นแต่ละคนเป็นฟังก์ชันต่อเนื่องในเซตโพรไฟล์กลยุทธ์ และกึ่งเว้าต่อกลยุทธ์ของตัวเอง เกมนั้นก็จะมีจุดสมดุลแบบแนชอย่างน้อยหนึ่งจุด กล่าวได้ว่า ทฤษฎีบทของแนชเป็นกรณีเฉพาะของทฤษฎีบททั่วไปนี้[10]:34

สมดุลแบบสมบูรณ์ทุกเกมย่อย

เกมนี้มีจุดสมดุลแบบแนชคือ (A,d) และ (B,c) แต่ (A,d) ไม่ใช่จุดสมดุลที่สมบูรณ์ในเกมย่อย

สมดุลแบบแนชเป็นแนวคิดคำตอบที่นิยามจากเกมในรูปแบบกลยุทธ์ ซึ่งสามารถนำมาใช้กับเกมที่มีการตัดสินใจเป็นลำดับก่อนหลังได้เนื่องจากสามารถเขียนเกมออกไปในรูปแบบกลยุทธ์ได้โดยเปรียบเสมือนว่าผู้เล่นแต่ละฝ่ายเลือกกลยุทธ์ของตนเองทั้งเกมก่อนที่จะเริ่มเล่นเกมจริงๆ แต่สมดุลของแนชในเกมที่มีลำดับก่อนหลังอาจมีลักษณะที่มองได้ว่าเป็นการตัดสินใจที่ไม่สมเหตุสมผล เนื่องจากผู้เล่นสามารถเลือกกลยุทธ์ที่เรียกว่า "คำขู่ที่ไม่น่าเชื่อถือ" (non-credible threat) ซึ่งมีลักษณะเหมือนกับการที่ผู้เล่นขู่ไว้ล่วงหน้าว่าจะเลือกทางที่ทำให้ตนเองเสียประโยชน์ เพื่อกดดันผู้เล่นฝ่ายอื่นที่ตัดสินใจก่อนหน้าให้เลือกทางเลือกอื่นแทน

สมดุลแบบสมบูรณ์ทุกเกมย่อย (subgame perfect equilibrium) เป็นแนวคิดคำตอบที่กำหนดว่าการตัดสินใจของผู้เล่นจะต้องเป็นจุดสมดุลแบบแนชในทุกเกมย่อย (subgame) ที่เริ่มจากจุดยอดใดๆ ในเกม จุดสมดุลแบบสมบูรณ์ทุกเกมย่อยสามารถหาได้ด้วยวิธีการนิรนัยย้อนกลับ (backward induction) ซึ่งหมายถึงการพิจารณาตัดทางเลือกที่ไม่สมเหตุสมผลจากสิ้นสุดของเกมย้อนไปหาจุดเริ่มต้นของเกม

เกมแบบร่วมมือ

แนวทางการวิเคราะห์เกมแบบร่วมมือ มักประกอบด้วยการเลือกวิธีการจับกลุ่มของผู้เล่นหรือแบ่งผลประโยชน์ ที่เป็นไปตามเงื่อนไข (สัจพจน์) บางประการที่กำหนด เช่น ประสิทธิภาพ ความสมมาตร ความเท่าเทียม ความเสถียร เป็นต้น[13] แนวคิดผลเฉลยของเกมแบบร่วมมือ อาจมีลักษณะเป็นเซต เช่น คอร์ เซตเสถียร หรือมีลักษณะเป็นจุดเดียว เช่น ค่าแชปลีย์ นิวคลีโอลัส เป็นต้น

คอร์

คอร์ (core) เป็นเซตของการแบ่งอรรถประโยชน์ที่ไม่มีกลุ่มผู้เล่นใดๆ ที่สามารถได้ประโยชน์มากขึ้นด้วยการแยกไปตั้งกลุ่มของตนเองได้ ในเกมแบบที่สามารถยกอรรถประโยชน์ให้กันได้ที่มีผู้เล่น n ฝ่าย คอร์หมายถึงเซตของเวกเตอร์การแบ่งผลประโยชน์ ( x 1 , x 2 , … , x n ) {\displaystyle (x_{1},x_{2},\dots ,x_{n})} ที่

∑ i ∈ S x i ≥ v ( S ) {\displaystyle \sum _{i\in S}x_{i}\geq v(S)}

สำหรับทุกกลุ่มผู้เล่น S {\displaystyle S} ที่เป็นซับเซตของผู้เล่นทั้งหมด[14]

ค่าแชปลีย์

แนวคิดค่าแชปลีย์ (Shapley value) เป็นแนวคิดคำตอบที่กำหนดการแบ่งอรรถประโยชน์แบบเจาะจงหนึ่งรูปแบบให้กับเกมแบบร่วมมือแต่ละเกม แนวคิดนี้เรียกตามชื่อของลอยด์ แชปลีย์ ผู้ที่เสนอแนวคิดนี้ในปี 1953 ค่าแชปลีย์เป็นการแบ่งอรรถประโยชน์รูปแบบเดียวที่เป็นไปตามเงื่อนไขสี่ประการนี้

  • ประสิทธิภาพแบบปาเรโต: ผลรวมของค่าของผู้เล่นทุกฝ่าย จะต้องเท่ากับค่าอรรถประโยชน์ v ( N ) {\displaystyle v(N)}
  • สมมาตร: หากผู้เล่นสองฝ่ายมีลักษณะเหมือนกันทุกประการ (นั่นคือ หากแทนที่ผู้เล่นฝ่ายหนึ่งด้วยผู้เล่นอีกฝ่ายหนึ่งในกลุ่มผู้เล่นใดๆ แล้ว มูลค่าของกลุ่มผู้เล่นนั้นจะไม่เปลี่ยนแปลง) ผู้เล่นสองฝ่ายจะต้องได้รับค่าเท่ากัน
  • ผู้เล่นศูนย์: หากว่ามีผู้เล่นที่ไม่ทำให้มูลค่าของกลุ่มผู้เล่นใดๆ เปลี่ยนแปลง ค่าที่ผู้เล่นนั้นได้รับจะเท่ากับศูนย์
  • สมบัติการบวก: หากว่านำเกมสองเกมมาบวกกัน ค่าแชปลีย์ของเกมนั้นจะเท่ากับผลบวกของค่าแชปลีย์ของแต่ละเกม

ค่าแชปลีย์สามารถนิยามได้ในลักษณะต่อไปนี้

S h i ( N ; v ) = ∑ S ⊆ N ∖ { i } | S | ! × ( n − | S | − 1 ) ! n ( v ( S ∪ { i } ) − v ( S ) ) {\displaystyle Sh_{i}(N;v)=\sum _{S\subseteq N\backslash \{i\}}{\frac {|S|!\times (n-|S|-1)!}{n}}(v(S\cup \{i\})-v(S))}