跳至內容

班佛定律

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

在數學中,班佛定律(英語:Benford's law)描述了真實數字數據集中首位數字的頻率分佈。一堆從實際生活得出的數據中,以1為首位數字的數的出現概率約為總數的三成,接近直覺得出之期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的概率就越低。它可用於檢查各種數據是否有造假。但要注意使用條件:1.數據之間的差距應該足夠大。2.不能有人為操控。[來源請求]

數學

班佛定律說明在進位制中,以起頭的數出現的概率為:

其中

班佛定律不但適用於個位數字,連多位的數也可用。

十進制首位數字的出現概率(%,小數點後一個位):

n 的相對大小
1 30.1% 30.1
 
2 17.6% 17.6
 
3 12.5% 12.5
 
4 9.7% 9.7
 
5 7.9% 7.9
 
6 6.7% 6.7
 
7 5.8% 5.8
 
8 5.1% 5.1
 
9 4.6% 4.6
 

不完整的解釋

一組平均增長的數據開始時,增長得較慢,由最初的數字增長到另一個數字起首的數的時間,必然比起首的數增長到,需要更多時間,所以出現率就更高了。

從數數目來說,順序從1開始數,1,2,3,...,9,從這點終結的話,所有數起首的機會似乎相同,但9之後的兩位數10至19,以1起首的數又大大拋離了其他數了。而下一堆9起首的數出現之前,必然會經過一堆以2,3,4,...,8起首的數。如果這樣數法有個終結點,以1起首的數的出現率一般都比9大。

另一種解釋如下. 當數據跨越多個數量級時,更自然的做法是畫在對數坐標中,如果這些數據在對數坐標下的分佈是均勻的,那麼班佛定律自然成立。即使在對數坐標下的概率密度函數不是常數,只要其變化足夠緩慢,且數據跨越了多個數量級,班佛定律也會近似成立,如下圖所示.

BenfordBroad

這個定律的嚴格證明,可以參見Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.。

應用

1972年,Hal Varian提出這個定律來用作檢查支持某些公共計劃的經濟數據有否欺瞞之處。1992年,Mark J. Nigrini便在其博士論文"The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies."(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它檢查是否有偽帳。

推而廣之,它能用於在會計學、金融甚至選舉中出現的數據。比如本福德定律曾被用作2009 年伊朗選舉舞弊的潛在證據 。[1]

若所用的數據有指定數值範圍;或不是以概率分佈出現的數據,如正態分佈的數據;這個定律則不準確。

歷史

1881年,天文學家西蒙·紐康發現對數表包含以1起首的數那首幾頁較其他頁破爛。

1938年,物理學家法蘭克·班佛英語Frank Benford再次發現這個現象,還通過了檢查許多數據來證實這點。

2009年,西班牙數學家在質數中發現了一種新模式,並且驚訝於為何現在才為人發現。雖然質數一般被認為是隨機分佈的,但西班牙數學家發現質數數列中每個質數的首位數字有明顯的分佈規律,它可以被描述了質數的班佛定律。這項新發現除了提供對質數屬性的新洞見之外,還能應用於欺騙檢測和股票市場分析等領域。[2]

參見

參考文獻

  1. ^ Statistics hint at fraud in Iranian election. 2009-06-24 [2024-03-21]. (原始內容需要付費訂閱存檔於2016-04-13) (英語). 
  2. ^ Bartolo Luque; Lucas Lacasa. The First-Digit Frequencies of Prime Numbers and Riemann Zeta Zeros. Proceedings: Mathematical, Physical and Engineering Sciences. 2009, 465 (2107): 2197–2216. JSTOR 30245457. doi:10.1098/rspa.2009.0126 (英語). 

參考