本文研究体彩“超级大乐透”玩法的中奖规律以及一些我关心的、或者觉得有趣的问题。可能的错误欢迎指正。

该玩法的详细介绍在这里。简而言之,玩家需要从 1-35 这 35 个自然数中选出 5 个不重复的数字构成前区,再从 1-12 这 12 个自然数中选择两个不重复的数字构成后区。前区和后区的数字可以相同。中奖条件如下表归纳。第四栏和第五栏分别为“前区猜中的号码数”和“后区猜中的号码数”的简写。有的奖项有若干种中奖方式,以字母分列。一注彩票只能中一个奖,不可兼中兼得:

  中奖条件 前区 后区 奖金
一等奖 开奖号码全部相同(顺序不限,下同) 5 2 5000000(假定值)
二等奖 5个前区号码及任意1个后区号码 5 1 50000(假定值)
三等奖 5个前区号码相同 5 0 5000(假定值)
四等奖 任意4个前区号码及2个后区号码 4 2 3000
五等奖 任意4个前区号码及任意1个后区号码 4 1 600
六等奖(A) 任意4个前区号码相同 4 0 100
六等奖(B) 任意3个前区号码及2个后区号码相同 3 2 100
七等奖(A) 任意3个前区号码及任意1个后区号码相同 3 1 10
七等奖(B) 任意2个前区号码及2个后区号码 2 2 10
八等奖(A) 任意3个前区号码相同 3 0 5
八等奖(B) 任意1个前区号码及2个后区号码相同 1 2 5
八等奖(C) 任意2个前区号码及任意1个后区号码相同 2 1 5
八等奖(D) 2个后区号码相同 0 2 5

下表概括各个奖项的中奖概率。势(Cardinality)是一个表示集合大小的概念,读者可自行替换为“可能的号码组合数”。C(N,M) 为组合数函数,其数值为 N!/(M!(N-M)!)(看不懂的就直接跳到结果吧,我就不指望你给我修正错误了)。所有购买彩票办法的势为 C(35,5)*C(12,2) = 21425712。我们假定(我认为这是一个十分可靠的假定)开奖是公平的。也就是说,每一次开奖(不同期数)都是独立的;前区与后区的开奖也是独立的;前区的五个奖号同时抽取且出现概率均等(各 1/35);后区的两个奖号同时抽取且出现概率均等(各 1/12)。各个奖项的中奖概率为它们各自的势除以所有购买彩票办法的势。各个奖项中奖概率等信息如下:


  计算公式 出现概率 奖金数学期望
一等奖 C(5,5)*C(30,0)*C(2,2)*C(10,0) 1 0.000000047 0.2334
二等奖 C(5,5)*C(30,0)*C(2,1)*C(10,1) 22 0.000001027 0.0513
三等奖 C(5,5)*C(30,0)*C(2,0)*C(10,2) 55 0.000002567 0.0128
四等奖 C(5,4)*C(30,1)*C(2,2)*C(10,0) 150 0.000007001 0.0210
五等奖 C(5,4)*C(30,1)*C(2,1)*C(10,1) 3300 0.000154021 0.0924
六等奖(A) C(5,4)*C(30,1)*C(2,0)*C(10,2) 8250 0.000385051 0.0385
六等奖(B) C(5,3)*C(30,2)*C(2,2)*C(10,0) 4350 0.000203027 0.0203
七等奖(A) C(5,3)*C(30,2)*C(2,1)*C(10,1) 95700 0.004466596 0.0447
七等奖(B) C(5,2)*C(30,3)*C(2,2)*C(10,0) 40600 0.001894920 0.0189
八等奖(A) C(5,3)*C(30,2)*C(2,0)*C(10,2) 239250 0.011166490 0.0558
八等奖(B) C(5,1)*C(30,4)*C(2,2)*C(10,0) 137025 0.006395353 0.0320
八等奖(C) C(5,2)*C(30,3)*C(2,1)*C(10,1) 893200 0.041688230 0.2084
八等奖(D) C(5,0)*C(30,5)*C(2,2)*C(10,0) 142506 0.006651168 0.0333
总计 C(35,5)*C(12,2) 21425712 1 0.8765


以下是一些推断出的事实(简单的话就不给公式了):
  • 一注彩票中任意奖项的势为 1564409,概率为 7.30%。——就是说,平均约 14 注就有一注可以中奖。我觉得不是特别低,但我还是没有中过。这果然就是人品问题了。
  • 一注彩票奖金的数学期望为 0.88 元。成本为 2 元。也就是说,买一注彩票收益的数学期望为 -1.12 元。追加投注的情况比较简单,不讨论。
  • 开奖号码(前区加后区)奇数数目为 0、1、2、3、4、5、6 和 7 个的概率由下表列出。如果从统计常用的阿尔法阈值 5% 来判断一个事件发生的概率是否显著地低,那么奇数数目为 2-6 个皆属正常。
    奇数数 出现概率
    0 92820 0.00433
    1 865368 0.04039
    2 3195660 0.14915
    3 6052680 0.28250
    4 6336036 0.29572
    5 3665880 0.17110
    6 1088748 0.05082
    7 128520 0.00600
    总计 21425712 1
  • 假设小于 18 的前区号码为小号,那么前区出现 0、1、2、3、4 或 5 个小号的概率由下表给出。那么,除非都是小号或者都不是小号,前区的大小数分布其概率都不是特别低。
    奇数数 出现概率
    0 565488 0.02639
    1 3433320 0.16024
    2 7324416 0.34185
    3 6866640 0.32049
    4 2827440 0.13196
    5 408408 0.01906
    总计 21425712 1
  • 前区出现一个或更多二连号或更多连号的势不少于:C(34,1)*C(33,3)*C(12,2) = 12243264,概率为 57.1%。也就是说,没有连号的概率不大于 42.9%。(精确计算较为复杂,暂时没空,我很乐意听取有兴趣的读者提出的算法。)
  • 前区出现三连号的势不小于 (精确计算较为复杂,暂时没空):C(33,1)*C(32,2)*C(12,2) = 1080288,概率为 5.04%,也不是特别低。


我需要提醒读者:以上事实对于选择一个可以中奖的号码是没有帮助的。然而我想我还是将继续购买彩票,毕竟这个社会、这个世界的公平游戏是如此的少(想想考大学、考研、考公务员……)。两块钱参与一个 fair game 还是很划算的。