從研究到教學：五隻魚的部落格: 統計名詞解釋

2009年10月6日星期二

統計名詞解釋

本篇為針對”Development of physical and mental health summary scores from the PROMIS global item”這篇期刊文獻中出現的統計名詞做簡單解釋：

EFA ＆ CFA

下圖為一簡單因素分析之示意圖。○表因素、□表測驗項目或所蒐集到的資料、△表該測驗項目可能具有的誤差。

當研究者想瞭解某些量表或測驗項目包含哪些未知的結構（construct，或稱潛在構念），便可使用探索性因素分析來瞭解因素的結構。若是要確認資料是否與理論相符，則使用驗證性因素分析。如果驗證性因素分析結果發現各項因素的分數差不多，則表示該項測驗不具有良好的區辨力，也就是造成交叉負荷（cross loading）。為避免混淆因素分析的結果，通常會將該項測驗刪除。

→Exploratory factor analysis (EFA)：探索性因素分析。用以瞭解因素的結構，即有哪些因素。一般較常以EFA > 0.4表示該項目與潛在構念有相關。數值介於0-1。

→Confirmatory factor analysis (CFA)：驗證性因素分析。可判斷所蒐集的資料與已知模型(例如：有哪些因素會影響某些結果)是否相符合。)CFA的值可表示所得到的資料可反映因素至多少程度。數值介於0-1。

其他統計名詞：

Residual correlation：誤差間相關。通常用於假設或預期誤差之間有相關才會使用。例如：系統性誤差。

系統性誤差：為可控制、可預測的誤差。常指測驗本身的差異，例如：題數多寡、題目難度甚至取樣的適切性，又稱常誤或偏誤。比如：欲驗證社經地位高的家庭，其子女未來之收入也會比較高。而評估的收入的量表可能指能測出具體、實際的財富，或是某些來源的收入。而且在測量家長與子女的時候，都用該評估工具，而造成結果的偏差，就稱作系統性誤差。

非系統性誤差：源自環境、身心狀況等因素導致測驗所得分數與實際分數間的差異。多為無法或較難預知的誤差來源。

graded response model：等級反應模式。由F. Samejima所提出。它是一種項目反應理論(IRT)，特別是針對次序變項而設計的。此模式可視為雙參數模式的延伸。當等級反應模式用於二元計題目時，等級反應模式就和雙參數模式完全相同。
The Graded Response Model is a type of polytomous IRT model, specifically designed for ordinal manifest variables. This model was first discussed by Samejima (1969) and it is mainly used in cases where the assumption of ordinal levels of response options is plausible.
The model is defined as follows

logit(gamma_ik) = beta_ik - beta_i z,

where gamma_{ik} denotes the cumulative probability of a response in category kth or lower to the ith item, given the latent ability z. If constrained = TRUE it is assumed that β_i = β for all i.
If IRT.param = TRUE, then the parameters estimates are reported under the usual IRT parameterization, i.e.,

logit (gamma_ik) = beta_i (z - beta_ik^*),

where beta_ik^* = beta_ik / beta_i.
The fit of the model is based on approximate marginal Maximum Likelihood, using the Gauss-Hermite quadrature rule for the approximation of the required integrals.
參考網頁：http://rss.acs.unt.edu/Rdoc/library/ltm/html/grm.html

Item-scale correlation：測量一量表中，每一項目的相關性。是否都是測某一面相（概念的）題目。若是相關性越高，表示該量表的結果越能反應此概念。

CFI：測量model與資料之間的相符程度的index。

其他詞彙

one-factor model / two-factor model：從探索性因素分析可得到量表或項目的組成結構有哪些。若是組成結構（或稱因素）只有一個，便可稱作one-factor model。也就是該一現象，只有一個影響因子。若是有兩個因素，便稱作two-factor model。

3 則留言:

再見金光源2009年10月7日凌晨3:02
學術上的慣例中，因素應該以橢圓形來代表；此外，因素與觀察變項之間不是線條，而是單向箭頭，從因素指向觀察變項。

CFA「可提供因素的顯著性考驗」：這句話怪怪的，應該說CFA是為了驗證data是否符合某已知模型。
回覆刪除
回覆
五隻魚2009年10月7日清晨6:50
感謝學長的建議，
晚一點來修改一下......
回覆刪除
回覆
Ching-Lin Hsieh2009年10月10日下午2:52
學術之路，好友同行，信心倍增!!

專有名詞可加上原文，如 latent trait.
另外亦可加上參考文獻，或相關網址，以利後續參考。
回覆刪除
回覆

新增留言

2009年10月6日 星期二

統計名詞解釋

3 則留言:

2009年10月6日星期二