有趣的第一数字定律
时间:2021-03-27 08:13:54 来源:达达文档网 本文已影响 人
我们的生活中有许多有趣的数字,比如人口数、GDP、死亡率,还有大家最熟悉的成绩表等。那么,这些互不相干的数据之间有规律可循吗?
1935年,美國通用电气公司的一位物理学家弗兰克·本福特发现了一个奇妙的定律:只要统计的样本足够多,同时数据没有特定的上限和下限,那么数据中以1为开头的数字出现的频率是30.10%,而以2为首的数字出现的频率为17.60%,以3打头的数字出现的频率为12.50%……首位数越大出现的频率依次减少,9出现的频率最低,只有4.60%。
是不是很神奇?这就是著名的“第一数字定律”,也叫“本·福特定律”。我们通过下面这几个例子来感受一下吧!
GDP数据中的发明
我们常常在新闻中听到“GDP”这个名词,接下来,我们不妨以我国31个地区2017年的GDP数据为例,来看看它们是否符合第一数字定律。
数据分析
对照31个地区的GDP数据,经地整理和分析,看看打头数字出现的概率:
根据分析我们可以看出,31个地区的GDP数据比较接近第一数字定律。
这也提醒我们, “第一数字定律”只有在统计样本足够多的时候才能生效。这里只用了31个数据显然是不够的,我们获取的数据样本太少。
斐波拉契数列的规律
除了之前说的统计数据外,很多数列也满足第一数字定律,比如著名的斐波拉契数列、素数数列等。是不是觉得很神奇(7
所谓的斐波拉契数列也被叫作“兔子数列”,出自]3世纪意大利数学家斐波那契的《算盘书》。我们在《成语中的数学》这篇文章里介绍了斐波那契数列的来由,这个数列的特点是后一个数字是前面两个数字的和,写出来就是1、1、2、3、5、8、13、21、34、55、89……
下表中,我们列出了斐波拉契数字前面150个,数一数,这些斐波拉契数字中以1~9打头的数字分别有多少个呢?
数据分析
耐心数一数,这150个斐波拉契数字中有44个1打头的数字,有27个2打头的数字……当统计到第150个数字时,斐波拉契数列和第一数字定律的误差已经非常小了!
实际上,有人统计过,随着样本继续增加,斐波拉契数列与第一数字定律是完全吻合的。
世界各国人口数
当数据样本更多的时候,又会出现什么情况呢?我们以214个国家和地区的人口数据为例,进一步来分析。
数据分析
分析发现,1打头的数字占30.05%,2打头的数字占15.02%……
当样本扩大到214个,统计结果和第一数字定律比起来,十分接近!
测试一下:
第一数字定律的实际运用
第一数字定律还可以用来查账。如果做假账的人更改了账本上真实的数据,就会使账本上打头数字出现的频率发生变化,从而偏离“第一数字定律”。
2001年,曾是美国最大的能源交易商、全球500强中排名第七的安然公司在事先没有任何征兆的情况下突然宣布破产,随后传出了该公司涉嫌做假账的丑闻。事后,人们发现,安然公司200 1年度到2002年度所公布的每股盈利数字完全不符合“第一数字定律”,后来证明安然公司确实改动过数据。
现在,人们还没有找到“第一数字定律”的形成原因,但它在我们的生活中却越来越广泛地被应用。如右表,这是欧盟目前28个成员国2016年的GDP,一列是真实的数据,另一列中包含了伪造的数据。你能一眼看出哪一列是真实的吗?