2015年1月10日 星期六

請教王文中老師的問題(1/13更新)

I.        問題一:若欲驗證評估工具的measurement invariance,使用哪些指標與驗證方法較為適宜?以下所列的各種判斷指標與驗證方法之優缺點是否恰當?有無其它更好的驗證方法?
指標
驗證方法
優點
缺點
因素結構
in fit, out fit MNSQ <1 .4="" span="">、殘差的PCA的第一因素 < 2判斷是否符合單向度
判斷標準明確
若分析多個時間點,有時後要刪題,有時候不需刪題。因素結構是否一致?
題目難度排序
直接比較
判斷標準明確
當題目內容與個案的其它特質(例如:文化)有交互作用時,題目難度排序似乎並不適合作為判斷指標。
題目難度值
1.看絕對的難度數值
2.計算不同時間點的題目難度之相關
數值容易取得
1.如何判斷數值的差異多少,是可以接受的?
2.相關係數的判斷標準為何?( > 0.6即為高相關,但是題目難度的相關程度0.6,似乎不算高)
Person reliability
直接比較
數值容易取得
如何判斷數值的差異多少,是可以接受的?
補充說明:
1.      measurement invariance (又稱measurement equivalence)是指評估工具應用於不同時間點或族群時,可得到相似的心理計量特性的結果。
2.    用於IRT,  measurement invariance的指標包含因素結構、題目難度排序、題目難度的數值、信度。

II.      問題二:若評估工具不具備measurement invariance(例如:題目難度的排序有變化),請問您建議如何進行後續處理(例如:刪題?)、應用時又該留意什麼事情?


III.    問題三、當Rasch分析為單向度,CFA的結果卻不是單向度,應該採信那一個結果呢?請問可能會是甚麼原因造成這個結果?
補充說明
1.      量表特性:一般自我效能量表(General self-efficacy scale), 10題。每題皆為4點量尺,無反向題。分數越高表示自我效能越好。

2.      資料特性:受訪者為1176位肢體受傷的住院病人,年齡、教育程度與工作類別差異很大。一般自我效能量表的評量分數偏高。

沒有留言:

張貼留言