I.
問題一:若欲驗證評估工具的measurement
invariance,使用哪些指標與驗證方法較為適宜?以下所列的各種判斷指標與驗證方法之優缺點是否恰當?有無其它更好的驗證方法?
指標
|
驗證方法
|
優點
|
缺點
|
因素結構
|
in fit, out fit 的MNSQ <1 .4="" span="">、殘差的PCA的第一因素 < 2判斷是否符合單向度1>
|
判斷標準明確
|
若分析多個時間點,有時後要刪題,有時候不需刪題。因素結構是否一致?
|
題目難度排序
|
直接比較
|
判斷標準明確
|
當題目內容與個案的其它特質(例如:文化)有交互作用時,題目難度排序似乎並不適合作為判斷指標。
|
題目難度值
|
1.看絕對的難度數值
2.計算不同時間點的題目難度之相關
|
數值容易取得
|
1.如何判斷數值的差異多少,是可以接受的?
2.相關係數的判斷標準為何?(
> 0.6即為高相關,但是題目難度的相關程度0.6,似乎不算高)
|
Person reliability
|
直接比較
|
數值容易取得
|
如何判斷數值的差異多少,是可以接受的?
|
補充說明:
1.
measurement invariance (又稱measurement equivalence)是指評估工具應用於不同時間點或族群時,可得到相似的心理計量特性的結果。
2. 用於IRT, measurement invariance的指標包含因素結構、題目難度排序、題目難度的數值、信度。
II.
問題二:若評估工具不具備measurement invariance(例如:題目難度的排序有變化),請問您建議如何進行後續處理(例如:刪題?)、應用時又該留意什麼事情?
III.
問題三、當Rasch分析為單向度,CFA的結果卻不是單向度,應該採信那一個結果呢?請問可能會是甚麼原因造成這個結果?
補充說明
1.
量表特性:一般自我效能量表(General
self-efficacy scale), 共10題。每題皆為4點量尺,無反向題。分數越高表示自我效能越好。
2.
資料特性:受訪者為1176位肢體受傷的住院病人,年齡、教育程度與工作類別差異很大。一般自我效能量表的評量分數偏高。
沒有留言:
張貼留言