《数字女孩》中的数学知识

「ハードナッツ! 〜数学girlの恋する事件簿〜」(Hard Nuts! 数字女孩的恋爱事件簿)这部NHK原创推理剧,以推理的眼光看,只能说差强人意,案件都过于简单。但推理之外,仍然不乏看点:桥本爱的精彩演出,背景音乐里流淌的柴可夫斯基《胡桃夹子》旋律,还有案件中穿插的数学。本文尽量在不剧透的情况下介绍一下重要的几处数学知识。

第一个案子应用到的主要是概率学。现代概率论是从帕斯卡(Blaise Pascal)讨论赌博问题开始发展的,这一集里,主人公难波胡桃也运用她出色的头脑计算牌型出现的概率,以此来决定下注数量。稍后,伴田警官在一次体检中发现得了一种罕见病,几率只有万分之一,而检测的准确率为99.9%。心灰意冷的他不打算进行复查,难波却告诉他,他得病的可能性并不是99,9%,而只是10%,原因是一万人之中只有一个人得病,但却有10个人会被诊断成阳性。我们显然能够看出来,她的解释是粗略的,但对于不具备概率知识的人而言,这样的解释比较容易理解。严密的计算需要利用贝叶斯公式

$$ P(A|B)=\frac{P(A)P(B|A)}{P(\bar{A})P(B|\bar{A})+P(A)P(B|A)} $$

计算知道第一次检查阳性,伴田得病的概率为9.08%。

之后的某个案件同样应用了概率学。警方导入了一个犯罪预测系统,用来预计辖区内各处案件发生的概率,据此配备警力部署。然而难波发现,这个系统的命中率过高,发生这些案子的概率很低,认为其中有人为的操控。

第二个案子的决定性证据是钢琴的调音。音乐的每一个音符,都有特定的频率。古希腊数学家毕达哥拉斯发现,两个音的频率成简单整数比的时候,就会产生谐音。毕达哥拉斯进一步认为,凡由两个不同音高的音所构成的音程,它们的频率关系必然是3的次方除以2的次方,或是2的次方除以3的次方,以此为基础创制了毕达哥拉斯调音法。同时,在遥远的中国发展起来的十二律,也与毕氏调音法一致。毕氏调音法的音程不是定值,与之相反,现代的最主要的调音法十二平均律,将一个八度分成十二等分,相邻两个音的频率之间的倍数恒定,都是$ ^{12}\sqrt{2} $。这个数不是有理数,因此谐音之间的频率比值也只能是近似的简单整数比。虽然十二平均律已经成为西方音乐的基础,最先发现这个比率的却是明代万历年间的朱载堉(看这个名字就知道,他是明朝的皇族),后来可能是由利玛窦传入西方世界。

接下来的推理中,为了分析绑架案的勒索信,运用了计量文献学(stylometry)。这门学科把文献的特征数值化,使用统计学的方法,分析和比较文献。通常进行数值化的文献特征有单词和语句的长度、特定词汇和表达方式的使用率、同义语的使用偏好等等。这门学科是19世纪末由《圣经》研究开始发展起来的,可以想见,如今方兴未艾的机器学习技术会给这个学科极大的促进。

下面一个小知识仍然与统计有关。美国经济学家Orley Ashenfelter在上世纪80年代发表了一个预测波尔多葡萄酒的品质公式,并成功预测到1989年的葡萄酒品质是一个世纪里最好的。公式建立在对历史数据的回归分析基础上,有三个变量:冬季降水量,夏季平均气温,收获季降水量。公式看似简单,但要得到一个能够用于预测的公式并不容易。这一集里,还根据碎片的幂律分布特性,判断出现场被人重新布置过。