在迴歸分析 當中,最常用的估計
β
{\displaystyle \beta }
(迴歸系數 )的方法是普通最小平方法 (英語:ordinary least squares ,簡稱OLS),它基於誤差值之上。用這種方法估計
β
{\displaystyle \beta }
,首先要計算殘差平方和 (residual sum of squares ;RSS),RSS是指將所有誤差值 的平方 加起來得出的數:
R
S
S
=
∑
i
=
1
n
e
i
2
{\displaystyle RSS=\sum _{i=1}^{n}e_{i}^{2}\,}
β
0
{\displaystyle \beta _{0}}
與
β
1
{\displaystyle \beta _{1}}
的數值可以用以下算式計算出來:
β
^
1
=
∑
(
x
i
−
x
¯
)
(
y
i
−
y
¯
)
∑
(
x
i
−
x
¯
)
2
{\displaystyle {\widehat {\beta }}_{1}={\frac {\sum (x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{\sum (x_{i}-{\bar {x}})^{2}}}}
β
^
0
=
y
¯
−
β
^
1
x
¯
{\displaystyle {\widehat {\beta }}_{0}={\bar {y}}-{\widehat {\beta }}_{1}{\bar {x}}}
當中
x
¯
{\displaystyle {\bar {x}}}
為
x
{\displaystyle x}
的平均值,而
y
¯
{\displaystyle {\bar {y}}}
為
y
{\displaystyle y}
的平均值。
假設總體的誤差值有一個固定的方差 ,這個方差可以用以下算式估計:
σ
^
ε
2
=
R
S
S
n
−
2
.
{\displaystyle {\hat {\sigma }}_{\varepsilon }^{2}={\frac {RSS}{n-2}}.\,}
這個數就是均方誤差 (mean square error),這個分母是樣本大小減去模型要估計的參數的量。這個迴歸模型當中有兩個未知的參數(
β
0
{\displaystyle \beta _{0}}
與
β
1
{\displaystyle \beta _{1}}
)。[ 1]
而這些參數估計的標準誤差 (standard error)為:
σ
^
β
1
=
σ
^
ε
1
∑
(
x
i
−
x
¯
)
2
{\displaystyle {\hat {\sigma }}_{\beta _{1}}={\hat {\sigma }}_{\varepsilon }{\sqrt {\frac {1}{\sum (x_{i}-{\bar {x}})^{2}}}}}
σ
^
β
0
=
σ
^
ε
1
n
+
x
¯
2
∑
(
x
i
−
x
¯
)
2
=
σ
^
β
1
∑
x
i
2
n
{\displaystyle {\hat {\sigma }}_{\beta _{0}}={\hat {\sigma }}_{\varepsilon }{\sqrt {{\frac {1}{n}}+{\frac {{\bar {x}}^{2}}{\sum (x_{i}-{\bar {x}})^{2}}}}}={\hat {\sigma }}_{\beta _{1}}{\sqrt {\frac {\sum x_{i}^{2}}{n}}}}
有了上面這個模型,研究者手上就有會有
β
0
{\displaystyle \beta _{0}}
與
β
1
{\displaystyle \beta _{1}}
的估計值,就可以用這個算式來預測
Y
{\displaystyle Y}
的數值。
參見
參考資料
^ Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences. , McGraw Hill, 1960, page 288.