ประวัติ ของ ทฤษฎีเกม

ก่อนปี 1928

ในการศึกษาที่มีลักษณะทางทฤษฎีเกมก่อนปี 1950 มีหัวใจสำคัญคือแนวคิดแบบมินิแมกซ์ นั่นคือ ผู้เล่นแต่ละฝ่ายเปรียบเทียบผลลัพธ์ที่แย่ที่สุดที่เป็นไปได้ของทางเลือกแต่ละทางของตัวเอง แล้วเลือกทางเลือกการันตีผลลัพธ์ที่ดีที่สุด (นั่นคือ ผลลัพธ์ที่แย่ที่สุดของทางเลือกนั้น ดีกว่ากว่าผลลัพธ์ที่แย่ที่สุดของทางเลือกอื่นๆ) การวิเคราะห์เกมในลักษณะของมินิแมกซ์มีหลักฐานย้อนไปถึงปี 1713 ที่การวิเคราะห์เกมไพ่ เลอ แอร์ (ฝรั่งเศส: le Her) ของของเจมส์ วอลด์เกรฟ ได้รับการเขียนถึงในจดหมายจากปีแยร์ เรมง เดอ มงมอร์ถึงนีโคเลาส์ แบร์นูลลี[15]

ในปี 1913 แอ็นสท์ แซร์เมโล นักคณิตศาสตร์ชาวเยอรมัน ตีพิมพ์บทความ "ว่าด้วยการประยุกต์ทฤษฎีเซตในด้านทฤษฎีหมากรุก" (เยอรมัน: Uber eine Anwendung der Mengenlehre auf die Theorie des Schachspiels) ซึ่งพิสูจน์ว่า ผลลัพธ์แบบมินิแมกซ์ของเกมหมากรุกสากลมีผลแพ้ชนะเพียงหนึ่งแบบ แต่ไม่มีการพิสูจน์ว่า ผลมินิแมกซ์ของเกมมีลักษณะเป็นฝ่ายใดชนะหรือเสมอกัน เกมที่ผลลัพธ์แบบมินิแมกซ์มีผลแพ้ชนะแบบเดียวนี้เรียกว่าเป็นเกมที่กำหนดแล้วโดยแท้ (strictly determined) ทฤษฎีบทของแซร์เมโลใช้ได้กับกับเกมแบบขยายที่มีผู้เล่นสองคน มีทางเลือกที่จำกัด มีผลแพ้ชนะและผู้เล่นมีสารสนเทศสมบูรณ์ (ไม่มีการเดินพร้อมกัน และสารสนเทศทุกอย่างเปิดเผยให้ผู้เล่นทุกฝ่ายทราบ) เช่น หมากฮอส หมากล้อม เฮกซ์ เป็นต้น[8]

เอมีล บอแรล นักคณิตศาสตร์ชาวฝรั่งเศส ตีพิมพ์บทความฉบับในปี 1921, 1924 และ 1927 โดยเป็นการวิเคราะห์กลยุทธ์ผสมและผลเฉลยแบบมินิแมกซ์ทางคณิตศาสตร์อย่างเป็นระบบครั้งแรก แต่บอแรลพิสูจน์เฉพาะในกรณีอย่างง่าย และสันนิษฐานว่าผลเฉลยแบบมินิแมกซ์นี้ไม่ได้มีอยู่เป็นการทั่วไป แต่ข้อสันนิษฐาน ฟอน นอยมันน์ ได้พิสูจน์ในภายหลังว่าไม่เป็นจริง

แนวคิดสมดุลแบบแนชก็มีการใช้ในการวิเคราะห์ทฤษฎีเศรษฐศาสตร์มาก่อนหน้าเช่นกัน ในปี 1838 อ็องตวน-โอกุสแต็ง กูร์โน ได้ตีพิมพ์หนังสือ "งานวิจัยว่าด้วยหลักคณิตศาสตร์ของทฤษฎีทรัพย์" (ฝรั่งเศส: Recherches sur les principes mathématiques de la théorie de la richesses) โดยมีเนื้อหาบทหนึ่งที่มีทฤษฎีวิเคราะห์ตลาดผูกขาดโดยผู้ขายน้อยราย แบบจำลองทางคณิตศาสตร์ของกูร์โนใช้การวิเคราะห์ที่มีลักษณะเป็นสมดุลแบบแนชรูปแบบหนึ่ง นับว่าเป็นงานเขียนชิ้นแรกที่มีการใช้แนวคิดสมดุลแบบแนช แต่กูร์โนไม่ได้เล็งเห็นว่าแนวคิดการวิเคราะห์ของเขาสามารถมีนัยทั่วไปที่ใช้กับสถานการณ์เชิงกลยุทธ์ใดๆ

ฟอน นอยมันน์และมอร์เกินสแตร์น

จอห์น ฟอน นอยมันน์

ในปี 1928 จอห์น ฟอน นอยมันน์ตีพิมพ์บทความ "ว่าด้วยทฤษฎีของเกมนันทนาการ"[16] (เยอรมัน: Zur Theorie der Gesellschsftsspiele) บทความของฟอน นอยมันน์นำเสนอทฤษฎีของเกมที่มีลักษณะทั่วไปกว่างานก่อนหน้า โดยตั้งคำถามว่า "ผู้เล่น n คน S1, S2,...,Sn เล่นเกม G ผู้เล่น Sm คนใดคนหนึ่งจะต้องเล่นอย่างไรจึงจะได้ผลลัพธ์ที่ดีที่สุด" ในบทความนี้ ฟอน นอยมันน์ได้กำหนดเกมรูปแบบขยาย และนิยาม "กลยุทธ์" ว่าหมายถึงแผนการเล่นที่ระบุการตัดสินใจของผู้เล่นที่จุดต่างๆ ในเกม โดยขึ้นกับสารสนเทศที่ผู้เล่นมีในจุดนั้นๆ ซึ่งเป็นลักษณะเดียวกับแนวคิดวิธีการเล่นของบอแรล การนิยามกลยุทธ์ในลักษณะนี้ทำให้ฟอน นอยมันน์สามารถลดรูปเกมแบบขยายให้เหลือเพียงการเลือกกลยุทธ์ของผู้เล่นแต่ละฝ่ายโดยอิสระจากกันก่อนเริ่มเกมเท่านั้น[17] ฟอน นอยมันน์พิสูจน์ว่า ในเกมที่มีผู้เล่นสองฝ่ายที่ผลรวมเป็นศูนย์และแต่ละฝ่ายมีทางเลือกจำนวนจำกัด หากว่าผู้เล่นสามารถใช้กลยุทธ์ผสมได้ เกมนี้จะมีจุดมินิแมกซ์หนึ่งจุดเสมอ[8] เนื้อหาการพิสูจน์ทฤษฎีบทของฟอน นอยมันน์มีลักษณะที่เกี่ยวข้องกับทฤษฎีบทจุดตรึงของเบราว์เออร์ แม้ว่าฟอน นอยมันน์ไม่ได้เขียนการพิสูจน์ในลักษณะของจุดตรึงในบทความ[18] ฟอน นอยมันน์ยกตัวอย่างเกมนันทนาการในบริบทนี้ว่าอาจหมายถึงเกมหลายประเภท เช่น รูเล็ตต์และหมากรุกสากล แต่ก็กล่าวถึงด้วย ความสัมพันธ์ในลักษณะของเกมนี้สามารถอธิบายสถานการณ์อื่นๆ ได้ด้วย โดยได้เขียนในเชิงอรรถว่าคำถามนี้มีลักษณะเหมือนคำถามในวิชาเศรษฐศาสตร์[19]:62

อ็อสคาร์ มอร์เกินสแตร์น เป็นนักเศรษฐศาสตร์ที่ในขณะนั้นสนใจเกี่ยวกับปฏิสัมพันธ์ระหว่างการตัดสินใจของบุคคลหลายฝ่าย ในหนังสือเรื่องการพยากรณ์ทางเศรษฐกิจที่ตีพิมพ์ในปี 1928 มอร์เกินสแตร์นได้ยกตัวอย่างการต่อกรกันระหว่างตัวละครเชอร์ล็อก โฮมส์กับมอริอาร์ตี ที่โฮมส์พิจารณาหลายชั้นว่ามอริอาร์ตีคิดว่าเขาจะทำอย่างไร[20] มอร์เกินสแตร์น มอร์เกินสแตร์นได้รับคำแนะนำจากนักคณิตศาสตร์เอดูอาร์ด เช็คระหว่างนำเสนอบทความที่งานสัมมนาในกรุงเวียนนาในปี 1935 ว่าหัวข้องานของมอร์เกินสแตร์นมีเนื้อหาเกี่ยวข้องกับงานทฤษฎีเรื่องเกมของฟอน นอยมันน์[21] หลังจากการผนวกออสเตรียเข้ากับนาซีเยอรมนีในปี 1938 มอร์เกินสแตร์นย้ายจากเวียนนาไปยังมหาวิทยาลัยพรินซ์ตันในสหรัฐอเมริกา ทำให้เขาได้พบและมีโอกาสได้ร่วมงานกับฟอน นอยมันน์ จนมีผลงานเป็นหนังสือ "ทฤษฎีว่าด้วยเกมและพฤติกรรมทางเศรษฐกิจ"[11] (Theory of games and economic behavior) ที่ตีพิมพ์ครั้งแรกในปี 1944[20][21]

ทศวรรษ 1950

จอห์น แนช

หลังจากที่หนังสือของฟอน นอยมันน์และมอร์เกินสแตร์นได้รับการตีพิมพ์ ทศวรรษ 1950 เป็นช่วงที่มีผลงานด้านทฤษฎีเกมที่สำคัญหลายอย่าง โดยมีสถาบันสำคัญที่เป็นศูนย์กลางสองแห่งคือมหาวิทยาลัยพรินซ์ตัน และแรนด์ คอร์เปอเรชัน สถาบันวิจัยเอกชนที่ตั้งขึ้นใหม่ที่มุ่งเน้นการทำวิจัยด้านความมั่นคงให้กับรัฐบาลสหรัฐ

ในช่วงปี 1950 ถึง 1953 จอห์น แนช ได้ตีพิมพ์บทความสำคัญสี่บทความซึ่งมีบทบาทสำคัญอย่างมากต่อสาขาทฤษฎีเกม จากนิยามเกมรูปแบบทั่วไปของฟอน นอยมันน์และมอร์เกินสแตร์น แนชได้นิยามแนวคิดสมดุลสำหรับเกมในรูปแบบทั่วไปที่เรียกในภายหลังว่าเป็นสมดุลแบบแนช และพิสูจน์ว่าเกมรูปแบบทั่วไปที่มีผู้เล่นและกลยุทธ์จำกัดทุกเกมที่ผู้เล่นสามารถใช้กลยุทธ์ผสมจะมีจุดสมดุลอย่างน้อยหนึ่งจุด ผลงานนี้ตีพิมพ์ครั้งแรกในบทความสั้นชื่อ "จุดสมดุลในเกมที่มีผู้เล่น n ฝ่าย"[22] (Equilibrium points in n-person games) ในปี 1950 แนชเขียนถึงแนวคิดสมดุลนี้ในวิทยาพนธ์ปริญญาเอก[17] และตีพิมพ์เนื้อหาฉบับสมบูรณ์ยิ่งขึ้นในบทความปี 1951 ชื่อ "เกมแบบไม่ร่วมมือ"[6] (Non-cooperative games)

จากเดิมที่เนื้อหาในหนังสือของฟอน นอยมันน์และมอร์เกินสแตร์นไม่ได้แยกระหว่างการที่ผู้เล่นแต่ละฝ่ายเลือกกลยุทธ์อย่างเป็นอิสระจากกันและการร่วมมือกัน แนชเป็นคนแรกที่จำแนกทฤษฎีเกมแบบร่วมมือและแบบไม่ร่วมมือ โดยแนวคิดสมดุลแบบแนชเป็นแนวคิดแบบไม่ร่วมมือ แนชยังได้ตีพิมพ์บทความในลักษณะของทฤษฎีเกมแบบร่วมมือ โดยในบทความปี 1950 ชื่อ "ปัญหาการต่อรอง"[23] (The bargaining problem) แนชได้เสนอผลลัพธ์ของเกมการต่อรองระหว่างผู้เล่นสองฝ่ายโดยใช้สัจพจน์สี่ประการ บทความนี้ของแนชเป็นงานชิ้นแรกในสาขาทฤษฎีเกมที่ไม่ใช้สมมติว่าอรรถประโยชน์สามารถยกให้กันได้ระหว่างผู้เล่น บทความนี้มีที่มาจากข้อเขียนของแนชตั้งแต่สมัยเรียนวิชาเศรษฐศาสตร์ระหว่างประเทศในระดับปริญญาตรี[24] ในปี 1953 แนชตีพิมพ์บทความ "เกมแบบร่วมมือที่มีผู้เล่นสองฝ่าย"[25] (Two-person cooperative games) ผลงานของแนชด้านทฤษฎีเกมทำให้แนชได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ในปี 1994

อัลเบิร์ต ทักเคอร์ (ซึ่งเป็นที่ปรึกษาปริญญาเอกของจอห์น แนช, ลอยด์ แชปลีย์, และเดวิด เกล) และฮาโรลด์ คุห์น นักคณิตศาสตร์ที่พรินซ์ตัน ได้เป็นบรรณาธิการตีพิมพ์ชุดหนังสือรวมเล่มผลงานวิจัยในด้านทฤษฎีเกม โดยตีพิมพ์เล่มแรกใน 1950 ในหนังสือเล่มที่สองที่ตีพิมพ์ในปี 1953 ลอยด์ แชปลีย์ นักศึกษาปริญญาเอกที่พรินซ์ตัน ได้ตีพิมพ์บทความที่นำเสนอแนวคิดคำตอบที่เรียกในภายหลังว่าค่าแชปลีย์ นอกจากนี้ แชปลีย์ ร่วมกับดอนัลด์ จิลลีส ได้เสนอแนวคิดคอร์

ทศวรรษ 1960 เป็นต้นมา

ในปี 1965 ไรน์ฮาร์ท เซ็ลเทิน ได้ตีพิมพ์บทความที่วิเคราะห์แบบจำลองการผูกขาดโดยผู้ขายน้อยรายด้วยทฤษฎีเกม ในบทความนี้ เซ็ลเทินได้เสนอแนวคิดสมดุลแบบสมบูรณ์ทุกเกมย่อย ซึ่งเป็นการนิยามสมดุลแบบแนชที่ละเอียดขึ้นเพื่อแยกสมดุลแบบแนชที่มีลักษณะไม่สมเหตุสมผลในเกมที่มีลำดับก่อนหลังออกไป การนิยามสมดุลที่ละเอียดยิ่งขึ้นเป็นหัวข้อวิจัยสำคัญในช่วงทศวรรษ 1960 และ 1970 โดยในปี 1975 เซ็ลเทินได้เสนอแนวคิดสมดุลแบบสมบูรณ์ ที่นิยามจุดสมดุลที่สมมติว่าผู้เล่นอาจจะ "มือลั่น" เลือกกลยุทธ์ที่ผิดจากกลยุทธ์ในจุดสมดุลได้

พัฒนาการสำคัญในทฤษฎีเกมแบบไม่ร่วมมือที่เกิดขึ้นในทศวรรษ 1960 อีกข้อหนึ่งคือการจำลองสถานการณ์ที่ผู้เล่นมีสารสนเทศไม่เท่ากัน จอห์น ฮาร์ชาญี ได้ตีพิมพ์บทความที่เสนอแนวคิดเกมแบบเบยส์ (Bayesian game) ที่ตอนเริ่มเกมผู้เล่นแต่ละฝ่ายมีสารสนเทศส่วนตัวที่ทราบแต่เพียงฝ่ายเดียว เรียกว่าเป็น "ประเภท" ของผู้เล่น และระบุว่าผู้เล่นฝ่ายอื่นเชื่อว่า ประเภทของผู้เล่นนี้มีการแจกแจงความน่าจะเป็นแต่ละแบบอย่างไร

ความสำคัญของทฤษฎีเกมในสาขาเศรษฐศาสตร์ ทำให้นักวิจัยสาขาทฤษฎีเกมได้รับรางวัลเพื่อระลึกถึงอัลเฟรด โนเบล สาขาเศรษฐศาสตร์หลายคน โดยในปี 1994 จอห์น แนช, ไรน์ฮาร์ท เซ็ลเทิน และจอห์น ฮาร์ชาญี ได้รับรางวัลในปี 1994 ต่อมา รอเบิร์ต ออมันน์ และทอมัส เชลลิง ได้รับรางวัลร่วมกันในปี 2005 โดยเชลลิงศึกษาทางด้านแบบจำลองพลวัต ซึ่งเป็นตัวอย่างแรกๆ ของทฤษฎีเกมเชิงวิวัฒนาการ ออมันน์เน้นศึกษาเกี่ยวกับดุลยภาพ ได้ริเริ่มดุลยภาพแบบหยาบ ดุลยภาพสหสัมพันธ์ และพัฒนาการวิเคราะห์ที่เป็นระเบียบมากขึ้นสำหรับสมมติฐานที่เกี่ยวกับความรู้ร่วมและผลที่ตามมา เลออนิด คูร์วิช, เอริก มัสกิน และโรเจอร์ ไมเออร์สัน ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ในปี 2007 จาก "การวางรากฐานทฤษฎีการออกแบบกลไก" และอัลวิน รอธ และลอยด์ แชปลีย์ ได้รับรางวัลในปี 2012 "สำหรับทฤษฎีการจัดสรรอย่างคงที่และการใช้การออกแบบตลาด"