從研究到教學：五隻魚的部落格: 請教王文中老師的問題(1/13更新）

2015年1月10日星期六

I. 問題一：若欲驗證評估工具的measurement invariance，使用哪些指標與驗證方法較為適宜？以下所列的各種判斷指標與驗證方法之優缺點是否恰當？有無其它更好的驗證方法？

指標	驗證方法	優點	缺點
因素結構	in fit, out fit 的MNSQ <1 .4="" span="">、殘差的PCA的第一因素 < 2判斷是否符合單向度	判斷標準明確	若分析多個時間點，有時後要刪題，有時候不需刪題。因素結構是否一致？
題目難度排序	直接比較	判斷標準明確	當題目內容與個案的其它特質（例如：文化）有交互作用時，題目難度排序似乎並不適合作為判斷指標。
題目難度值	1.看絕對的難度數值 2.計算不同時間點的題目難度之相關	數值容易取得	1.如何判斷數值的差異多少，是可以接受的？ 2.相關係數的判斷標準為何？（ > 0.6即為高相關，但是題目難度的相關程度0.6，似乎不算高）
Person reliability	直接比較	數值容易取得	如何判斷數值的差異多少，是可以接受的？

補充說明：

1. measurement invariance （又稱measurement equivalence）是指評估工具應用於不同時間點或族群時，可得到相似的心理計量特性的結果。

2. 用於IRT， measurement invariance的指標包含因素結構、題目難度排序、題目難度的數值、信度。

II. 問題二：若評估工具不具備measurement invariance（例如：題目難度的排序有變化），請問您建議如何進行後續處理（例如：刪題？）、應用時又該留意什麼事情？

III. 問題三、當Rasch分析為單向度，CFA的結果卻不是單向度，應該採信那一個結果呢？請問可能會是甚麼原因造成這個結果？

補充說明

1. 量表特性：一般自我效能量表(General self-efficacy scale), 共10題。每題皆為4點量尺，無反向題。分數越高表示自我效能越好。

2. 資料特性：受訪者為1176位肢體受傷的住院病人，年齡、教育程度與工作類別差異很大。一般自我效能量表的評量分數偏高。

從研究到教學：五隻魚的部落格