心理統計學

心理統計學（英語：Psychometrics）是統計學方法在心理學以及教育學測量領域的應用。它的目的是測量人的能力、知識、態度、性格特徵等，並且發展相應的工具。

起源與背景

在心理統計學早期的理論和應用之中，重點集中在測量人的智力。弗朗西斯·高爾頓經常被認為是心理統計學之父。他設計和應用了一系列的心理測試。但是，心理統計學的起源經常和心理物理學聯繫到一起。心理統計學的先驅Charles Spearman曾經從師於心理物理學家Wilhelm Wundt。Spearman設計了測量智力的早期方法之一。著名的心理統計學家L. L. Thurstone曾經發展了後來被稱為比較判斷法則的測量方法，這個方法被認為和由恩斯特·海因里希·韋伯與Gustav Fechner這兩位心理物理學家所發明的測量方法有緊密聯繫。他們所發展的統計測量方法現在也在心理統計學界廣泛應用。

近幾十年，心理統計學被廣泛應用於測量人的性格、態度和信仰、教育產出、以及健康相關的領域。測量這些不可觀察的特徵是非常困難的，在理論界，許多的研究都致力於準確的定義這些概念並且把他們量化。於是對此的評批也聚集於對於這些定義和量化工作的懷疑。很多批評來自於物理學界以及社會科學的激進分子，他們認為很多時候這種測量是不準確的，而且被濫用了。但心理統計學的倡導者認為這些濫用數據往往來自於對於心理統計學準則的忽視。他們也反駁到，物理學所研究的很多無法被觀測到的屬性比如力的作用和熱能，也是依靠推斷它們的表現才得以被研究的。

分類

描述統計——集中趨勢分析、離中趨勢分析、相關分析
推論統計——參數分析、非參數分析

從內容上看，心理統計學可分為描述統計和推論統計兩大部分。其中描述統計又分為集中趨勢分析和離中趨勢分析和相關分析三大部分。推論統計又可按樣本容量分為Z檢驗，T檢驗，P檢驗三大類方法。按參與計算的數據個數分，又有單總體檢驗，平均數差異檢驗（兩總體差異的研究）和多因素分析三種計算。按數據處理方法又可分為參數分析和非參數分析。

描述統計

描述統計（descriptive statistics) 又分為集中趨勢分析和離中趨勢分析和相關分析三大部分。

集中趨勢分析主要靠平均數、中位數、眾數等統計指標來表示數據的集中趨勢。例如考試的平均成績是多少分？是正偏分佈還是負偏分佈？

離中趨勢分析主要靠全距、四分差、方差(平方差)、標準差、差異係數等統計指標來研究數據的離中趨勢。例如，我們想知道兩個教學班的語文成績中，哪個班級內的成績分佈更分散，就可以用兩個班級的四分差或百分點來比較。

相關分析探討數據之間是否具有統計學上的關聯性。這種關係既包括兩個數據之間的單一相關關係——如年齡與個人領域空間之間的關係，也包括多個數據之間的多重相關關係——如年齡、抑鬱症發生率、個人領域空間之間的關係。相關分析大概分為正相關（如：一個數值愈大另一個數值就會愈大/一個數值愈小另一個數值就會愈小）和負相關（如：一個數值大另一個數值就會愈小/一個數值小另一個數值就會愈大）的直線相關關係，也可以是複雜相關關係（A＝Y－B*X）；還包括兩變量共同變化的緊密程度——即相關係數。實際上，相關關係唯一不研究的數據關係，就是數據協同變化的內在根據——即因果關係。這是因為相關分析不論就兩個因子間的關係得出數之間的結論。例如：一個人的朋友數量越多，自信心也會越高（正相關），但我們不能知道，究竟是朋友數量的上升導致自信心增加，還是自信心高的人導致他/她有更多的朋友。獲得相關係數有什麼用呢？簡而言之，有了相關係數，就可以根據回歸方程，進行A變量到B變量的估算，這就是所謂的回歸分析，因此，相關分析是一種完整的統計研究方法，它貫穿於提出假設，數據研究，數據分析，數據研究的始終。

例如，我們想知道對監獄情景進行什麼改造，可以降低囚徒的暴力傾向。我們就需要將不同的囚舍顏色基調、囚舍綠化程度、囚室人口密度、防風時間、探視時間進行排列組合，然後讓每個囚室一種實驗處理，然後用因素分析法找出與囚徒暴力傾向的相關係數最高的因素。假定這一因素為囚室人口密度，我們又要將被試隨機分入不同人口密度的十幾個囚室中生活，繼而得到人口密度和暴力傾向兩組變量（即我們討論過的A、B兩列變量）。然後，我們將人口密度排入X軸，將暴力傾向分排入Y軸，獲得了一個很有價值的圖表，當某典獄長想知道，某囚舍擴建到N人/間囚室，暴力傾向能降低多少。我們可以當前人口密度和改建後人口密度帶入相應的回歸方程，算出擴建前的預期暴力傾向和擴建後的預期暴力傾向，兩數據之差即典獄長想知道的結果。

推論統計

母數統計分析

在學術研究中，研究員不可能收集全人類的相關數據。因此，推論統計(inferential statistics )是基於有限數據來推斷大趨勢的統計分析。其中，母數統計分析需假設數據中的趨勢是正態分佈。推論統計以數據結果為依據，來證明或推翻某個假設。具體來說，就是通過分析樣本採集的數據，來推斷總人口的實際情況或同一樣本的前後測成績差異、樣本與樣本的成績差距、總體與總體的成績差距等。當中，研究員會基於數據間是否具有顯著性差異來決定假設是否成立。顯著性差異是一個統計學中的概率，說明研究裏獲得的數據差異有多大機會是因誤差而造成。通常，結果需顯示為至少少於5%（p數值至少少於.05）的概率，才算是顯著差異。例如，我們想研究教育背景是否會影響人的智力測驗成績。可以找一100名24歲大學畢業生和100名24歲初中畢業生。採集他們的比－西智力測驗成績。用推論統計方法進行數據處理，最後會得出類似這樣的結論：「研究發現，大學畢業生組的成績顯著高於初中畢業生組的成績，二者在.05水平上具有顯著性差異，說明大學畢業生的比－西智力測驗成績優於中學畢業生組。」。

推論統計的理論假設是概率論。概率論研究發現，當樣本總體的樣本容量達到特定值時候，則[樣本總體分佈]的形狀為Z分佈（樣本容量三十以上）、T分佈（樣本容量為三十到八）或P分佈（樣本容量為十以下）的。這時，我們從樣本總體中隨機抽出一個樣本，這個樣本落在這個樣本總體的中心區域的可能性較大，落在邊緣區域可能性較小，出了某一區域的可能性很小。這一規律在所有定樣本容量的數據分佈中都存在。因此，我們可把兩組數據放到一個坐標繫上，然後根據兩組數據的統計參數來比較兩個分佈是否有顯著性差異，並估算出猜錯的可能性。

推論統計中最常用到的指標為Z分數（大樣本研究）、T分數（小樣本研究）、P分數（二項分佈研究），檢驗方式主要有Z檢驗、T檢驗。除此以外，推理統計中另有非參數分析方法，可以根據數據的秩來計算統計結果。

推論統計結果的可靠性除了受到實驗方法和數據處理方法的影響，還受到樣本容量影響，根據過大或過小的樣本計算出的結論都可能是不可靠的，為此，心理統計學中又有ω²法和D值法來檢驗樣本是否大到足以影響推論的地步。

無母數統計分析

結語

一般地講，古典心理統計學的內容主要就是這些。隨着統計學、心理學、現代測量理論的發展，包括IRT理論（item response theory）理論在內的許多心理學數學研究方法仍在進一步充實心理統計學。實際上，用作心理統計核算的著名數學軟件——社會科學統計系統（簡稱SPSS）每年出一個新版本，而今已經連出了十三版。而且仍然在不斷添加新的數據處理程序。因而心理統計學既是古老的學科，又是不斷發展着的學科。

統計學也不僅應用在心理學領域，包括臨床醫學、教育學、社會學等社會社會科學都廣泛使用這些統計學的新成果。因此，想進一步了解心理統計的相關知識，可以搜索SPSS、SAS、心理測量學、現代心理測驗理論、數據處理方法、實驗心理學、實驗方法、統計學、社會學、統計、推理統計、醫學統計學等關鍵詞。

權威控制資料庫
國際	FAST
各地	西班牙法國 BnF data 德國以色列美國拉脫維亞捷克