2010年2月4日 星期四

統計名詞解釋-ANOVA、multipel regression analysis

在上文獻評析課程時,常聽同學討論到該研究之分析方式不當,
並建議改採以變數分析 ( analysis of variance, ANOVA ) 或多步驟迴歸分析 ( multiple regression analysis ) 。
尤其是多步驟迴歸分析,在同學口中,簡直像萬靈丹一樣好用!
但是個人還沒學到那麼深的統計,所以不確定是否合適。
在這裡,簡單就網路上查到的資料說明ANOVA和多步驟迴歸分析的原理和用途做介紹,
並補充了向李晏請教的一些觀念。
至於深入的計算和實際舉例,就不贅言,許多統計書上應該都查得到。

ANOVA:將一組資料的總變動量,依可能造成變動的因素分類,並以假設檢定的方法來判斷這些因素是否確實能解釋資料的變動。例如,我們想知道家庭環境(因子, factor)是否對學童課業好壞(試驗單位,experiment)造成影響,我們可以觀察在不同家庭環境(待遇, treatment)下成長的學童,其課業表現(反應變數 ,response variable)如何。


研究中分析的方法常常先作全體的F-分佈,若有顯著差異再作事後比較(如 Scheffé's method、Tukey-Kramer method、兩兩作t檢定)以了解其關係與差異所在。


複迴歸分析:是簡單相關的一種延伸應用,用以瞭解一組預測變項和一個效標變項的直線關係:而每個預測變項的預測能力,是研究者重要的參考指標。
例如: Yi聯考成績(效標變項,criterion)
Xi模擬考成績(預測變項,predictors)

當效標變項僅一個,而預測變項僅一個時,稱為簡單迴歸Y =a+bX
當效標變項僅Y一個,而預測變項二個以上時,則稱為單變項複迴歸(或多元迴歸)
=a+b1X1+b2X2+…+biXi。
...當效標變項二個以上,而預測變項二個以上時,則稱為多變項複迴歸。

而多步驟迴歸分析為複迴歸分析的一種,它適用於研究者剛投入一個新的領域、無法判斷那個變項對依變項影響較大時 ( 即r平方值較大 ),可用這個方法找出影響量較大的變項。

觀念澄清:有些學者會將所有變數作兩兩相關係數的研究,刪除相關係數低的變相,再作迴歸分析。但這是不恰當的,因為相關係數的高低僅能看出該變項對於依變項(結果)的貢獻度,但無法確保高相關係數的變項,就真的與結果有相關。
例如:某研究結果指出:國小學童腳掌的大小與數學成績有高度相關
探究其原因,發現是因為他沒有將學童依年齡分層,因此腳掌大小其實是年齡差異造成的。
所以單純只做兩個變項間的相關性,有時並沒有辦法解釋所欲瞭解的現象。

而相關係數低的變項,可能在控制某些變項後,才能凸顯它對結果的影響。
不過,在醫學領域有許多變數是很難的控制的,例如:生活習慣。
所以看研究主題與對象,可斟酌採用多步驟迴歸分析,做統計上的補救。


◎參考資料:
http://zh.wikipedia.org/wiki/%E6%96%B9%E5%B7%AE%E5%88%86%E6%9E%90
http://www.math.tku.edu.tw/chinese/mathhall/Sas/anova/procanova.htm
http://w2.nioerar.edu.tw/basis3/11/gf7.htm

沒有留言:

張貼留言