跳转到内容

箱形图

维基百科,自由的百科全书
箱形图

箱形图英文box plot),又称为盒须图盒式图盒状图箱线图,是一种用作显示一组数据分散情况资料的统计图。因图形如箱子,且在上下四分位数之外常有线条像胡须延伸出去而得名。

离群值会有时会画成是个别的点。箱型图是无母数的,他显示样品的特性,对于母体分布并无任何假设。在各种领域也经常被使用,常见于品质管理。不过作法相对较繁琐。

箱形图于1977年由美国著名统计学家约翰·图基John Tukey)发明。它能显示出一组数据的最大值最小值中位数、及上下四分位数

定义

以第1四分位数(Q1/4)和第3四分位数(Q3/4)的数值作为箱型的上下限。

范例

以下是箱形图的具体例子:

箱形图的使用范例

这组数据显示出:

  • 下边界=5
  • 第1四分位数(Q1)=7
  • 中位数、第2四分位数(median、Q2)=8.5
  • 第3四分位数(Q3)=9
  • 上边界=10
  • 四分位间距(interquartile range,简称IQR)==2 (即ΔQ)

当有数值与第1与第3四分位数的范围差距1.5×IQR以上时,该值为离群值(outlier)。

数值位于范围外1.5×IQR到3×IQR范围的数值,称作适度离群值(mild outlier)。
数值位于范围外3×IQR以上的数值,称作极端离群值(extreme outlier)。

因此该图中的离群值有:

  • 适度离群值(mild outlier) = 3.5
  • 极端离群值(extreme outlier) = 0.5

外部链接