การประมาณค่า ของ ปัญหาวันเกิด

กราฟแสดงความน่าจะเป็นโดยประมาณ ที่คนอย่างน้อยสองคนจะมีวันเกิดตรงกัน (แดง) และเหตุการณ์เติมเต็มของมัน (น้ำเงิน)กราฟแสดงความแม่นยำของการประมาณค่าด้วย 1 − e − n 2 / ( 2 × 365 ) {\displaystyle 1-e^{-n^{2}/(2\times 365)}} (ขาว)

การกระจายอนุกรมเทย์เลอร์ของฟังก์ชันเลขชี้กำลัง (ค่าคงตัว e ≈ 2.718281828)

e x = 1 + x + x 2 2 ! + ⋯ {\displaystyle e^{x}=1+x+{\frac {x^{2}}{2!}}+\cdots }

สามารถประมาณค่า ex อันดับที่หนึ่งเมื่อ x ≪ 1 ดังนี้

e x ≈ 1 + x   {\displaystyle e^{x}\approx 1+x\ }

เพื่อใช้การประมาณนี้แก่นิพจน์แรกที่มาจาก p̅(n) กำหนดให้ x = −i/365 ดังนั้นเราจะได้

e − i / 365 ≈ 1 − i 365   {\displaystyle e^{-i/365}\approx 1-{\frac {i}{365}}\ }

จากนั้นแทนที่ i ด้วยจำนวนเต็มไม่เป็นลบสำหรับแต่ละพจน์ในสูตรของ p̅(n) จนกระทั่ง i = n − 1 ตัวอย่างเช่นเมื่อ i = 1 จะได้

e − 1 / 365 ≈ 1 − 1 365   {\displaystyle e^{-1/365}\approx 1-{\frac {1}{365}}\ }

นิพจน์แรกที่มาจาก p̅(n) จึงสามารถประมาณค่าได้ดังนี้

p ¯ ( n ) ≈ 1 × e − 1 / 365 × e − 2 / 365 ⋯ e − ( n − 1 ) / 365 = 1 × e − ( 1 + 2 + ⋯ + ( n − 1 ) ) / 365 = e − ( n ( n − 1 ) / 2 ) / 365 {\displaystyle {\begin{aligned}{\bar {p}}(n)&\approx 1\times e^{-1/365}\times e^{-2/365}\cdots e^{-(n-1)/365}\\&=1\times e^{-(1+2+\cdots +(n-1))/365}\\&=e^{-(n(n-1)/2)/365}\end{aligned}}}

เพราะฉะนั้น

p ( n ) = 1 − p ¯ ( n ) ≈ 1 − e − n ( n − 1 ) / ( 2 × 365 ) {\displaystyle p(n)=1-{\bar {p}}(n)\approx 1-e^{-n(n-1)/(2\times 365)}}

การประมาณที่หยาบกว่าของสูตรดังกล่าวคือ

p ( n ) ≈ 1 − e − n 2 / ( 2 × 365 ) {\displaystyle p(n)\approx 1-e^{-n^{2}/(2\times 365)}}

ซึ่งยังคงแม่นยำพอใช้ได้ ดังที่เห็นจากกราฟในภาพประกอบ

จากการประมาณค่าดังกล่าว แนวทางที่เหมือนกันสามารถใช้ได้กับ "คน" และ "วัน" จำนวนเท่าใดก็ได้ ถ้าให้จำนวนวันเป็น n วันแทนที่จะเป็น 365 วัน ให้จำนวนคน m คน และ m ≪ n จากแนวทางข้างต้นเราจะได้ผลสำเร็จเป็น Pr[(m, n)] คือความน่าจะเป็นที่อย่างน้อยสองคนในกลุ่ม m คน มีวันเกิดตรงกันภายใน n วันที่กำหนด ดังนี้

P r [ ( m , n ) ] ≈ 1 − e − m 2 / 2 n   {\displaystyle Pr[(m,n)]\approx 1-e^{-m^{2}/2n}\ }

การยกกำลังอย่างง่าย

ความน่าจะเป็นที่คนสองคนไม่มีวันเกิดตรงกันเท่ากับ 364/365 หากกลุ่มคนมีจำนวน n คน จะสามารถจับคู่ได้ C(n, 2) = n(n − 1)/2 คู่ หรือเรียกได้ว่ามี C(n, 2) เหตุการณ์ ความน่าจะเป็นที่คนสองคนไม่มีวันเกิดตรงกันในกลุ่มคนดังกล่าว สามารถประมาณได้จากเหตุการณ์เหล่านี้ซึ่งสมมติว่าเป็นอิสระต่อกัน โดยคูณความน่าจะเป็นของพวกมันเข้าด้วยกัน กล่าวอย่างสั้นคือ 364/365 สามารถคูณกับตัวเองเป็นจำนวน C(n, 2) ตัว จะได้

p ¯ ( n ) ≈ ( 364 365 ) C ( n , 2 ) {\displaystyle {\bar {p}}(n)\approx \left({\frac {364}{365}}\right)^{C(n,2)}}

เนื่องจากสิ่งนี้คือความน่าจะเป็นที่ไม่มีใครมีวันเกิดตรงกัน ดังนั้นความน่าจะเป็นที่จะมีใครบางคนมีวันเกิดตรงกันก็คือ

p ( n ) ≈ 1 − ( 364 365 ) C ( n , 2 ) {\displaystyle p(n)\approx 1-\left({\frac {364}{365}}\right)^{C(n,2)}}

การประมาณปัวซง

ใช้การประมาณปัวซงสำหรับทวินามกับกลุ่มคน 23 คน

P o i ( C ( 23 , 2 ) 365 ) = P o i ( 253 365 ) ≈ P o i ( 0.6932 ) {\displaystyle \mathrm {Poi} \left({\frac {C(23,2)}{365}}\right)=\mathrm {Poi} \left({\frac {253}{365}}\right)\approx \mathrm {Poi} (0.6932)} Pr ( X > 0 ) = 1 − Pr ( X = 0 ) ≈ 1 − e − 0.6932 ≈ 1 − 0.499998 = 0.500002 {\displaystyle \Pr(X>0)=1-\Pr(X=0)\approx 1-e^{-0.6932}\approx 1-0.499998=0.500002}

ผลลัพธ์มีค่ามากกว่า 50% เช่นเดียวกับที่ได้อธิบายไว้ก่อนหน้านี้

การประมาณจำนวนคน

การประมาณจำนวนคนเท่าที่จำเป็นที่จะทำให้เกิดโอกาส 50% เป็นอย่างน้อยที่จะมีวันเกิดตรงกัน โดยแฟรงก์ เอช. แมทิส สามารถหาได้จากสูตรดังนี้

n ≈ 1 2 + 1 4 − 2 × 365 × ln ⁡ ( 0.5 ) = 22.999943 {\displaystyle n\approx {\frac {1}{2}}+{\sqrt {{\frac {1}{4}}-2\times 365\times \ln(0.5)}}=22.999943}

นี่เป็นผลลัพธ์ของการประมาณที่ดี ซึ่งเหตุการณ์ 1 ใน k ของความน่าจะเป็นจะมีโอกาสเกิดขึ้น 50% เป็นอย่างน้อย ถ้าเหตุการณ์นั้นเกิดซ้ำ k ln 2 ครั้ง [5]

ตารางความน่าจะเป็น

ดูบทความหลักที่: การโจมตีวันเกิด
ความยาว
สายอักขระ
ฐานสิบหก
#บิตขนาดของ
ปริภูมิแฮช
(2#บิต)
จำนวนสมาชิกของแฮชที่ทำให้ {ความน่าจะเป็นที่แฮชชนกันอย่างน้อยหนึ่งครั้ง = p}
p = 10−18p = 10−15p = 10−12p = 10−9p = 10−6p = 0.1%p = 1%p = 25%p = 50%p = 75%
8324.3×1092222.9932.9×1039.3×1035.0×1047.7×1041.1×105
16641.8×10196.11.9×1026.1×1031.9×1056.1×1061.9×1086.1×1083.3×1095.1×1097.2×109
321283.4×10382.6×10108.2×10112.6×10138.2×10142.6×10168.3×10172.6×10181.4×10192.2×10193.1×1019
642561.2×10774.8×10291.5×10314.8×10321.5×10344.8×10351.5×10374.8×10372.6×10384.0×10385.7×1038
(96)(384)(3.9×10115)8.9×10482.8×10508.9×10512.8×10538.9×10542.8×10568.9×10564.8×10577.4×10571.0×1058
1285121.3×101541.6×10685.2×10691.6×10715.2×10721.6×10745.2×10751.6×10768.8×10761.4×10771.9×1077

ช่องสีขาวในตารางนี้แสดงจำนวนสมาชิกของแฮชที่จำเป็น ที่ทำให้ความน่าจะเป็นที่แฮชชนกันตามกำหนด (ตามหลัก) โดยกำหนดปริภูมิแฮชในหน่วยบิตขนาดต่าง ๆ (ตามแถว) อุปมากับปัญหาวันเกิดได้ว่า "ขนาดของปริภูมิแฮช" คล้ายกับ "จำนวนวันที่ใช้ได้", "ความน่าจะเป็นที่แฮชชนกัน" คล้ายกับ "ความน่าจะเป็นที่คนมีวันเกิดตรงกัน", และ "จำนวนสมาชิกของแฮชที่จำเป็น" ก็คล้ายกับ "จำนวนคนที่จำเป็นในกลุ่ม" แน่นอนว่าใครก็ตามสามารถใช้แผนผังนี้เพื่อกำหนดขนาดของแฮชน้อยสุดที่จำเป็น (โดยกำหนดขอบเขตบนของแฮชและความน่าจะเป็นของความผิดพลาด) หรือความน่าจะเป็นที่แฮชชนกันได้ (เพื่อหาจำนวนแฮชตายตัวและความน่าจะเป็นของความผิดพลาด)

ยกตัวอย่างเพื่อการเปรียบเทียบ ความน่าจะเป็น 10−18 ถึง 10−15 คืออัตราความผิดพลาดบิตที่แก้ไขไม่ได้ของฮาร์ดดิสก์ทั่วไป [6] ฟังก์ชันแฮช 128 บิตอย่างเช่น เอ็มดี5 จึงควรดำรงอยู่ในช่วงนั้นจนกว่าจะแฮชเอกสารไปแล้วประมาณ 8.2 แสนล้านเอกสารในทางทฤษฎี ถึงแม้ว่าผลลัพธ์ที่เป็นไปได้ของมันจะมีได้มากยิ่งกว่านั้น

ใกล้เคียง

ปัญหา ปัญหาสิ่งแวดล้อมในประเทศไทย ปัญหาวิถีสั้นสุด ปัญหาราชวงศ์ ปัญหาปี ค.ศ. 2000 ปัญหาการแต่งงานที่มีเสถียรภาพ ปัญหาสิ่งแวดล้อมในประเทศอัฟกานิสถาน ปัญหาสกันทอร์ป ปัญหาวันเกิด ปัญหารางวัลมิลเลนเนียม