2013年8月15日 星期四

健康識能問卷發展與驗證之文獻閱讀(8/15更新)

我在週末閱讀了2篇與健康識能測驗心理計量特性驗證有關的文章。
因為覺得文章內容與OTK問卷之驗證與發展極有關係,因此將文中大意與個人心得整理如下。
歡迎大家提出各自的意見,一起討論。

(1)Jordan JE, Osborne RH, Buchbinder R. Critical appraisal of health literacy indices revealed variable underlying constructs, narrow content and psychometric weaknesses. J Clin Epidemiol. 2011;64:366-379.
閱讀心得這篇文章提供了完整且具體的項目,有助於評析健康識能問卷/測驗之心理計量特性。同時,本研究回顧了19篇健康識能的研究,歸納這些研究的個案特性、(健康識能)測驗題目數、如何發展測驗、測驗如何評分與目前心理計量驗證情形。以下僅就心理計量驗證的部份特別說明。

信度驗證:內部一致性、施測者間信度與再測信度。
1篇研究之內部一致性結果良好且可信。其它研究中,2篇研究內部一致性不佳(小於0.8,測驗題數小於7題),而內部一致性良好的測驗題數皆大於35題。
 
 1篇研究驗證施測者間信度且結果良好,但個人認為施測者對於知識型的測驗影響不大。
 
 3篇研究驗證再測信度,且結果差異很大(0.40-0.86)。個人認為是時間間隔差異很大、間隔過長(2-6個月)所致。

效度驗證:內容效度、表面效度、建構效度。敏感性與反應性則未驗證。
所有研究皆有驗證內容效度與表面效度。
建構效度的部分,多為驗證收斂效度,僅2篇為因素效度(CFA)但未符合作者選擇之所有適配度指標。

我的想法:本研究提出之評析項目皆屬合理,可用於確認OTK之研究設計與結果。又,內容效度與表面效度為健康適能測驗中,首要驗證之心理計量特性。建構效度中,收斂效度為大宗之可能原因為收斂效度較容易進行,而因素效度收案所需人數較多、不易得到好的結果(單一因素包含36-125題目),因此較少被驗證。信度健康適能測驗中驗證得較少,個人認為可能是健康識能測驗中,施測者間信度不太重要,再測信度易受再測時間間隔與記憶答案的影響因此較少驗證。而內在一致性易受測驗題數影響,似乎不是很好的指標。



閱讀心得
這篇文章為符合上一篇文獻之多數判斷標準的嚴謹研究。作者詳細說明了如何發展一份健康識能問卷,並強調他們採用的是以效度為導向的工具發展模式 (validity- driven instrument development approach),因此文中著重於效度驗證(專家效度、表面效度、建構效度與區辨效度)以及IRT驗證題目的選項的閾值的部分。結果共發展出一份含有9個面向的44題問卷,每個面向皆各自驗證單一面向性,結果皆為單一面向(判斷標準較為寬鬆)。

我的想法:

由此篇文章可學習嚴謹的健康識能問卷之研究設計,而且此篇文章亦屬以效度為導向的工具發展模式。可見於健康識能測驗/問卷之研究中,信度非首要之驗證項目。此外,各個面向各自驗證單一面向結構的資料分析方式與陳柏熹老師的建議相同。

對於後續
 OTK 問卷之設計與驗證之啟示:未來OTK問卷之設計需增加專家審核題目之次數。驗證部分,再測信度/複本信度或許可刪減;內容效度與表面效度照常進行,建構效度之收斂效度因無適用之工具無法進行,因素效度可能暫不執行。



3 則留言:

  1. looks good!
    我有些看法寫在我的 blog 請卓參 http://atriptouq.blogspot.com.au/2013/08/ot.html

    回覆刪除
  2. 第1&2篇的小結:看不到重點。
    後續的作法,心理計量驗證的部分,如果依據您的想法,那可能符合 Jordan評論的標準? 還是 Jordan 評論標準不重要(這也呼應:您有無看到重點)!?

    回覆刪除
    回覆
    1. 我已調整閱讀心得之內容,請老師再看一下。
      謝謝您。

      刪除