偏差样本

偏差样本（Biased Sample）、不具代表性的样本（Unrepresentative Sample），系指根据缺乏代表性的样本推论出一般性的结论。相似地，偏差统计（biased statistics）则指根据不恰当的统计方法推论出一般性的结论。

常见样本缺乏代表性的原因，一是样本数太小，二是样本并非随机抽出，往往因某些因素导致偏差。

示例

例1

美国人很有钱，可见美洲人很有钱。

然而，美国是美洲最富有的国家，不能代表美洲其他国家的情形，也不能代表整个美洲的情形。

例2

那位学者出书声称父母教养方式和子女人格特质的相关性为零，所以父母的养育对子女无用。

一、这是一家之言，未必是学界共识，引用单一权威未达成共识的做法也涉及误用诉诸权威的谬误；二、父母教养对子女人格特质无影响不代表父母教养对子女全无影响。

例3

我读的那本书，及那本书作者的著作告诉我，地理因素、文化差异或工作伦理不是造成一个国家经济繁荣、成为发达国家的主因，及早建立起民主且注重法治的社会制度，以及一些历史的偶然，才是一个国家经济繁荣、成为发达国家的主因。

特定书籍或作者的言论，未必是学界共识，即使内容写得再有理也一样。

例4

他是重点大学热门科系毕业的，结果还是长期失业、每天宅在家浪费时间打电玩，可见念好大学没有用。

然而有可能是这个人运气不好，或者自身性格真的有问题，或这人有其他的想法，因此就算念到好学校还是一样没有更好的就业前景，所以不能把他的状况类推到所有念重点大学热门科系的人身上。

例5

1936年美国总统选举前，《文学文摘》邮寄1,000万份问卷予其读者，回收230万份。他们预测共和党候选人阿尔夫·兰登会在531张选举人票中获得370张选票并胜过民主党候选人富兰克林·德拉诺·罗斯福。

该次总统大选，阿尔夫·兰登实际上只获得8张选举人票，而富兰克林·德拉诺·罗斯福则在大选中大胜。一个说法认为，《文学文摘》的读者相较于全美人口具有较高共和党人比例，故此他们更倾向于投票给阿尔夫·兰登。《文学文摘》的民调样本有明显的偏差。

例6

某甲严词批判某乙的作为，还把事情闹得很大，而就我个人的经验来看，某乙是个好人，可见某甲只是无来由地厌恶某乙，或者妒忌某乙而已。某甲应该要放下自己的怒火，接纳某乙，甚至应该向某乙道歉。

然而有可能其实是某乙一直都在搞小动作，把某甲逼到抓狂，或者有其他的理由，所以才会发生这样的事情的。因此不能因为跟一个人一两次的交流经验，而对一个人的性格下评断，尤其不应该下负面的评断。

例7

新闻常常在报性侵诬告、性骚扰诬告，可见性侵和性骚扰案一堆都是诬告，是女生跟男生上床后，企图对男生仙人跳而搞出来的。

然而性侵犯和性骚扰极度常见，研究也显示性侵犯和性骚扰的诬告率不高于其他犯罪，因此有可能是因为性侵犯和性骚扰被告上法院的案子非常多，所以诬告的总量也多，以致产生了性侵和性骚扰案件一堆诬告的错觉，甚至媒体的选择性报导也可能有影响，因此不能因为常常看见有性侵和性骚扰诬告的消息，就认定性侵和性骚扰的案子更有可能是诬告的。

偏差样本的形式

常见偏差样本谬误的形式如下：

轻率概化：只根据少数样本就做出一般性的结论。
采樱桃谬误：轻率概化的一种，系指根据少数样本被刻意挑选的样本做出一般性的结论。
轶事证据：只根据传闻、个案就做出一般性的结论。这些传闻往往细节详细、诩诩如生，或是被人一传再传，如新闻或巷议街谈。

外部链接

（英文）Logical Fallacy: Unrepresentative Sample（页面存档备份，存于互联网档案馆）

示例

偏差样本的形式

相关条目

外部链接