การคำนวณความน่าจะเป็น ของ ปัญหาวันเกิด

ปัญหาคือการคำนวณความน่าจะเป็นโดยประมาณว่า ในกลุ่มคน n คน จะมีอย่างน้อยสองคนที่มีวันเกิดตรงกัน สำหรับกรณีง่ายสุดคือไม่สนใจความแปรปรวนในการแจกแจง เช่นปีอธิกสุรทิน ฝาแฝด ความแปรปรวนเชิงฤดูกาลหรือวันในสัปดาห์ และสมมติว่าวันเกิดที่เป็นไปได้ 365 วันอย่างเท่าเทียมกัน การแจกแจงวันเกิดในชีวิตจริงไม่เป็นเอกรูปเพราะทุกวันมิได้มีโอกาสอย่างเท่าเทียมกัน

ถ้าให้ P(A) คือความน่าจะเป็นที่อย่างน้อยสองคนในกลุ่มมีวันเกิดตรงกัน เราอาจคำนวณง่ายขึ้นจาก P(A′) คือความน่าจะเป็นที่ไม่มีสองคนใดเลยที่มีวันเกิดตรงกัน เนื่องจาก A และ A′ เป็นความน่าจะเป็นเพียงสองประการที่จะเกิดขึ้นได้และเป็นเหตุการณ์ไม่เกิดร่วม ดังนั้นเราจะได้ P(A) = 1 − P(A′)

คำตอบของปัญหาที่เผยแพร่อย่างกว้างขวางสรุปว่า กลุ่มคน 23 คนก็เพียงพอที่จะทำให้ P(A) มีค่ามากกว่า 50% การคำนวณ P(A) ต่อไปนี้จะใช้กลุ่มคน 23 คนมาเป็นตัวอย่าง

เมื่อเหตุการณ์เป็นอิสระซึ่งกันและกัน ความน่าจะเป็นของเหตุการณ์ทั้งหมดที่เกิดขึ้น จะเท่ากับผลคูณของความน่าจะเป็นของแต่ละเหตุการณ์ที่เกิดขึ้น เพราะฉะนั้น P(A′) จึงสามารถแยกได้เป็นเหตุการณ์อิสระ 23 เหตุการณ์ และคำนวณได้จาก P(1) × P(2) × P(3) × ... P(23)

เหตุการณ์อิสระ 23 เหตุการณ์นี้สอดคล้องกับจำนวนคน 23 คนและสามารถนิยามไปตามลำดับ แต่ละเหตุการณ์สามารถนิยามว่าคนนั้นจะไม่มีวันเกิดตรงกับคนอื่นคนใดที่ได้วิเคราะห์ไปแล้วก่อนหน้า สำหรับเหตุการณ์ที่ 1 คือไม่มีคนอื่นคนใดก่อนหน้านี้ให้วิเคราะห์เลย เพราะฉะนั้นความน่าจะเป็น P(1) ซึ่งคนแรกไม่มีวันเกิดตรงกับคนอื่นคนใดที่ได้วิเคราะห์ไปแล้วก่อนหน้าเท่ากับ 1 หรือ 100% หรือเขียนในรูปแบบ 365/365 โดยไม่พิจารณาอธิกวารสำหรับการวิเคราะห์นี้ ส่วนเหตุผลจะได้ปรากฏชัดเจนต่อไป

สำหรับเหตุการณ์ที่ 2 คือมีเพียงคนที่หนึ่งที่ได้วิเคราะห์แล้วก่อนหน้านี้ สมมติว่าวันเกิดเป็นไปได้อย่างเท่าเทียมกัน 365 วันเช่นเดิม ความน่าจะเป็น P(2) ซึ่งคนที่สองมีวันเกิดต่างกับคนที่หนึ่งเท่ากับ 364/365 นั่นเป็นเพราะถ้าคนที่สองเกิดในวันใดก็ได้ในจำนวน 364 วันที่เหลือ ทำให้คนที่หนึ่งกับคนที่สองมีวันเกิดไม่ตรงกัน

ในทางเดียวกัน ถ้าคนที่สามเกิดในวันใดก็ได้ในจำนวน 363 วันที่เหลือ ทำให้ทั้งคนที่หนึ่ง ที่สอง ที่สาม มีวันเกิดไม่ตรงกันเลย จะได้ความน่าจะเป็น P(3) เท่ากับ 363/365

การวิเคราะห์เช่นนี้ดำเนินต่อไปจนกระทั่งถึงคนที่ยี่สิบสาม ซึ่งความน่าจะเป็นที่วันเกิดจะไม่ตรงกับคนที่ได้วิเคราะห์ไปแล้วก่อนหน้านี้เลย P(23) เท่ากับ 343/365

P(A′) เท่ากับผลคูณของความน่าจะเป็นรายเหตุการณ์เหล่านี้ นั่นคือ

P(A′) = 365/365 × 364/365 × 363/365 × 362/365 × ... × 343/365

สมการดังกล่าวสามารถดึงตัวประกอบร่วมได้เป็น

P(A′) = (1/365)23 × (365 × 364 × 363 × 362 × ... × 343)

ประเมินค่าออกมาจะได้ P(A′) ≈ 0.492703

ดังนั้น P(A) ≈ 1 − 0.492703 = 0.507297 หรือ 50.7297%

กระบวนการนี้สามารถทำให้เป็นกรณีทั่วไปสำหรับกลุ่มคน n คน เมื่อ p(n) คือความน่าจะเป็นที่อย่างน้อยสองคนในกลุ่ม n คนมีวันเกิดตรงกัน เราคำนวณง่ายขึ้นด้วย p̅(n) คือความน่าจะเป็นที่วันเกิดของ n คนแตกต่างกันทั้งหมด ตามหลักรังนกพิราบ p̅(n) จะเป็นศูนย์เมื่อ n > 365 และเมื่อ n ≤ 365 จะได้ว่า

p ¯ ( n ) = 1 × ( 1 − 1 365 ) × ( 1 − 2 365 ) × ⋯ × ( 1 − n − 1 365 ) = 365 × 364 × ⋯ × ( 365 − n + 1 ) 365 n = 365 ! 365 n ( 365 − n ) ! = n ! ⋅ ( 365 n ) 365 n = 365 P n 365 n {\displaystyle {\begin{aligned}{\bar {p}}(n)&=1\times \left(1-{\frac {1}{365}}\right)\times \left(1-{\frac {2}{365}}\right)\times \cdots \times \left(1-{\frac {n-1}{365}}\right)\\&={365\times 364\times \cdots \times (365-n+1) \over 365^{n}}\\&={365! \over 365^{n}(365-n)!}={\frac {n!\cdot {365 \choose n}}{365^{n}}}={\frac {^{365}P_{n}}{365^{n}}}\end{aligned}}}

โดยสัญลักษณ์ ! คือตัวดำเนินการแฟกทอเรียล ( 365 n ) {\displaystyle \textstyle {365 \choose n}} คือสัมประสิทธิ์ทวินาม และ k P r {\displaystyle {^{k}P_{r}}} หมายถึงการเรียงสับเปลี่ยน

สมการดังกล่าวแสดงข้อเท็จจริงว่า สำหรับคนที่หนึ่งไม่มีคนใดที่มีวันเกิดตรงกัน (365/365) สำหรับคนที่สองก็ไม่มีวันเกิดตรงกับคนที่หนึ่ง (364/365) สำหรับคนที่สามก็ไม่มีวันเกิดตรงกับคนที่หนึ่งและที่สอง (363/365) ฯลฯ และในกรณีทั่วไปวันเกิดของคนที่ n ก็จะไม่มีวันเกิดตรงกับ n − 1 คนที่อยู่ก่อนหน้า

เหตุการณ์ที่อย่างน้อยสองคนจากกลุ่มคน n คนมีวันเกิดตรงกัน คือเหตุการณ์เติมเต็มที่วันเกิดของ n คนแตกต่างกันทั้งหมด เพราะฉะนั้นความน่าจะเป็น p(n) จะมีค่าเท่ากับ

p ( n ) = 1 − p ¯ ( n ) {\displaystyle p(n)=1-{\bar {p}}(n)\,}

ความน่าจะเป็นนี้มีค่าเกินกว่า 1/2 เมื่อ n = 23 (ค่าจริงประมาณ 50.7%) ตารางต่อไปนี้แสดงความน่าจะเป็นสำหรับ n อื่น ๆ บางค่า (โดยไม่พิจารณาปีอธิกสุรทินตามที่ได้อธิบายแล้วด้านบน)

กราฟแสดงความน่าจะเป็นโดยประมาณ ที่ไม่มีใครเลยในกลุ่มคน n คนมีวันเกิดตรงกัน สังเกตว่ามาตราส่วนตามแนวตั้งเป็นลอการิทึม (แต่ละขีดจากบนลงล่างลดลงทีละ 1020 เท่า)
np(n)
1011.7%
2041.1%
2350.7%
3070.6%
5097.0%
5799.0%
10099.99997%
20099.9999999999999999999999999998%
300(100 − (6×10−80))%
350(100 − (3×10−129))%
365(100 − (1.45×10−155))%
366100%

ใกล้เคียง

ปัญหา ปัญหาสิ่งแวดล้อมในประเทศไทย ปัญหาวิถีสั้นสุด ปัญหาราชวงศ์ ปัญหาปี ค.ศ. 2000 ปัญหาการแต่งงานที่มีเสถียรภาพ ปัญหาสิ่งแวดล้อมในประเทศอัฟกานิสถาน ปัญหาสกันทอร์ป ปัญหาวันเกิด ปัญหารางวัลมิลเลนเนียม