2011年6月15日 星期三

迴歸分析期末報告筆記-1

迴歸分析的期末團體報告,老師要求用真實資料(不管是自己收案的或是資料庫的二手資料皆可)撰寫一篇像論文的作業,並上台報告。

在聽報告的時候,覺得大家的想法還滿有創意的,題目種類繁多,
例如:婚姻真的是愛情的墳墓嗎?(探討兩性相處的滿意度的影響因子)
感恩就會幸福?(探討感恩的行為是否能預測幸福感)
親子衝突與盡孝表現,是否可互相預測?
使用音樂的目的與人格特性的關係
也有比較嚴肅的研究(報告者為PT博班生),像是親子互動方式對孩童精熟動機(mastery motivation)的影響。

儘管主題不盡相同,卻都是用到迴歸分析的作法。
在聽同學們報告的同時,也確認自己自己的考慮是否周密、有無誤解之前上課的內容。
除了原本上課的知識,學到了一些實務的操作。
覺得很實用,因此記錄下來。


1.即使殘差圖、常態機率圖看起來很像常態,最好還是用用正式的統計方法檢驗是否真正為常態、變異數是否同質,再決定是否進行資料轉換。(有些統計軟體會附上數值)

2.若個案量夠大,決定進行交叉驗證,兩組人的數量最好能相近。

3.若欲使用中介變項(intervening variable),則應該有理論支持,不是想加就加,或是為了使結果好看才加。否則就過於操弄數據了!

4.不同時期的資料最好不要一起放入同一個一般線性迴歸式的X當中,因為無法控制時間的變異,也會有重複施測產生的共線性的問題。(可考慮用Hierarchical Linear Modeling、Repeated Measure Regression,或Generalized Estimating Equations處理)


其他仍待解決的問題
1.Y可以是不連續變項嗎?或是,要用其他的迴歸方式計算?

2.一個迴歸式中,Y可以有兩個嗎?(個人猜測應該是有)哪些情況下,需要有兩個以上的Y?如果可以,如果把一個迴歸式拆成兩個迴歸式,是否會有控制第一型錯誤率的問題?

3.處理界外值的方法,除了確定影響力大小(以Cook's D的F分配的PR值、DFFITS和DFBETAS值判斷)後刪除,或是從原始資料加權,變異大的加權少,變異小的加權多,使結果穩定。但是,何時要刪除,何時要加權呢?

(以上問題會在查資料後補上)


6 則留言:

  1. 哈囉,我是千瑀^^我來留言了!上課之後還能有這樣的反芻真的很了不起,我也應該要把東西都記下來才是!

    跟你分享我看完筆記後的想法,或許讀書會時也可以來討論XD

    關於變異量同質與常態分布其實我一直都有個疑惑,不曉得你知不知道,當資料不符合這些假設的時候,有時候會做資料的轉換,但是轉完之後,該怎麼去解釋或報告結果啊?是要把資料再轉回去嗎?

    然後我記得是Y的性質不同,就會用不同的regression方法,如果是連續變項的話,就是linear regression,二分變項就是logistic regression,其他不連續變項,就是polynominal regression,有多個Y,就multivariate regression,不過multivariate regression我是只聞其名而已,甚麼時候要用到也不是很清楚XD

    一個迴歸拆成兩個迴歸式是指Y一樣,而把所有的X分成兩部分跑嗎? 之前聽到的說法是最好把所有X都放在一起,大家一起去競爭,才能控制所有X之間的關係,得出比較正確的結果。但是好像不是控制第一型錯誤率的問題,是跟迴歸係數有關。

    另外,跟你分享一個我在上次報告發現的有趣現象,就是從一片空白開始學,跟有一些經驗後學習的差別XD 大學生的報告內容就像是一片空白開始學,老師上課教了什麼,他們就跑什麼,所以上課教的東西比較常出現在ppt當中。研究生的報告則比較傾向是建立在自己已經會的基礎上再加一些老師教的東西。前者有樸實照單全收的感覺,後者則有精緻卻排他的感覺XD

    大概是這樣吧!一起加油吧^^

    回覆刪除
  2. 我個人認為:當有多個Y的時候,目前學界似乎傾向使用結構方程模式structural equation modeling;

    拆成兩個迴歸式的話,我個人看到的作法似乎比較偏向最後合而回一?(不過這個需要context....)

    回覆刪除
  3. To 千瑀:
    感謝妳的補充,多個Y和多個迴歸式的問題,我們可以趁學期結束前,簡單問一下助教 XD

    關於變異數不同值的資料轉換,要怎麼解釋結果。
    我覺得應該就直接說XY的關係是對數關係就好了,
    但是為什麼他們是對數關係,這就很難解釋了...

    又,我也覺得大學生比較會用老師上課教的,因為他們也只會那些。
    研究生卻時常加了太多上課沒教的東西,好像線性迴歸對他們的幫助不怎麼大......

    回覆刪除
  4. To Antonio:
    感謝你的補充。
    可惜我現在還沒學到SEM,之後會找一些相關的書籍來看。

    至於,拆成兩個迴歸式,以X的角度而言是不利於控制地一型錯誤率,
    以Y而言(千瑀補充說)似乎會影響迴歸係數,
    但我也不是很瞭解。
    這還要多看點書、跟專家討論才知道了!

    回覆刪除