置換檢驗
置換檢驗(permutation test)是統計學上一種基於反證法、重抽樣原則的非參數性檢驗,由羅納德·艾爾默·費希爾(Ronald Aylmer Fisher)與E・J・G・皮特曼(E. J. G. Pitman)於20世紀30年代最早提出[1]。
置換檢驗的零假設(虛無假設)為,即所有樣本都服從同一分布。置換檢驗通過對比樣本置換後的檢驗統計量與置換前的檢驗統計量來決定是否拒絕零假設、接受備擇假設。
方法
進行置換檢驗前,首先計算兩樣本(樣本容量設為、)之間原本的檢驗統計量。檢驗統計量可以是兩樣本間平均數之差、方差之差,或t值、卡方檢驗中的值等,但這一統計量原則上在重新抽樣後應大致符合某一統計學分布(如常態分布、t分布、f分布等)[2]:355-360。隨後,將兩個樣本打亂後再重新選出兩組容量等於之前兩樣本的新樣本(即兩個樣本容量同樣為、的樣本)並計算新的檢驗統計量。如接受零假設,即樣本源於同一分布,則隨機抽樣計算出的新檢驗統計量應不難大於最初置換前算出的兩樣本間檢驗統計量(如為雙側檢驗,則是其絕對值應不難大於置換前算出的兩樣本間檢驗統計量),即這個概率應大於設定的I型錯誤(假陽性)概率。反之,則拒絕零假設,接受備擇假設,即樣本來自不同的分布。實際計算時,當兩個樣本容量都很大時,窮舉所有置換並計算新的檢驗統計量所需的計算量過於龐大,因此常採用蒙特卡羅模擬的辦法進行置換檢驗。蒙特卡羅模擬中,只做一定次數的打亂重選(置換)並計算檢驗統計量,再用這些計算出的檢驗統計量與置換前原本的檢驗統計量進行對比[3][4]。
優勢與不足
置換檢驗能用於兩個分布不明且都不符合常態分布的樣本之間的統計檢驗,是對較常用的t檢驗、方差分析(ANOVA)等參數檢驗的一個補充[5]。即使實驗是非均衡設計(即樣本容量不同),依然能夠對樣本進行置換檢驗[6]。
另一方面,和其他基於秩的非參數檢驗相似,置換檢驗是一種相對保守的檢驗。如果對兩個差別較小的小樣本進行置換檢驗,則很容易接受零假設、拒絕備擇假設(即檢驗功效相對較低)[7][8]。
參見
參考文獻
- ^ Boik, Robert J. The Fisher-Pitman permutation test: A non-robust alternative to the normal theory F test when variances are heterogeneous. British Journal of Mathematical and Statistical Psychology (Wiley). 1987, 40 (1): 26–42. ISSN 0007-1102. doi:10.1111/j.2044-8317.1987.tb00865.x.
- ^ Robert V. Hogg; Elliot A. Tanis; Dale L. Zimmereman. Probability and Statistical Inference Ninth Edition (International). Pearson. 2015. ISBN 978-1-292-06235-8.
- ^ Randomization Tests. Oklahoma State University. Ordination Methods for Ecologists. [2022-12-04]. (原始內容存檔於2023-06-08).
- ^ Wilcox, Rand R. COMPARING TWO INDEPENDENT GROUPS. Applying Contemporary Statistical Techniques. Elsevier. 2003: 237–284. doi:10.1016/b978-012751541-0/50029-8.
- ^ Collingridge, Dave S. A Primer on Quantitized Data Analysis and Permutation Testing. Journal of Mixed Methods Research. 11 September 2012, 7 (1): 81–97. S2CID 124618343. doi:10.1177/1558689812454457.
- ^ Invited Articles (PDF). Journal of Modern Applied Statistical Methods. Fall 2011, 1 (2): 202–522. (原始內容 (PDF)存檔於May 5, 2003).
- ^ Allison, D.B.; Page, G.P.; Beasley, T.M.; Edwards, J.W. DNA Microarrays and Related Genomics Techniques: Design, Analysis, and Interpretation of Experiments. Chapman & Hall/CRC Biostatistics Series. CRC Press. 2005: 261 [2022-12-07]. ISBN 978-1-4200-2879-9. (原始內容存檔於2022-12-07).
- ^ Berger, Vance W. Pros and cons of permutation tests in clinical trials. Statistics in Medicine (Wiley). 2000-05-30, 19 (10): 1319–1328. ISSN 0277-6715. doi:10.1002/(sici)1097-0258(20000530)19:10<1319::aid-sim490>3.0.co;2-0.