2012年4月26日 星期四

如何看羅吉斯迴歸的解釋變異量

這兩週的廣義線性模式課程的內容是羅吉斯迴歸 (logistic regression),因此對羅吉斯迴歸有一些概念。
雖然目前自己還沒用到,但是因為比其他同早一點點得知這些概念,而被誤以為對羅吉斯迴歸分析很熟,資料分析之後不會看報表,就拿結果來請我幫忙解釋......
我秉持著知之為知之的精神,盡可能把自己知道的說明清楚。
例如:deviance的概念是比較現有模型(current model,亦即逐步迴歸分析所得的結果)和飽和模型 (saturated model)或其他要用來比較的模型的差異。
因此,當現有模型與飽和模型越接近,deviance就越小。
如果以deviance的數值查卡方分配表,發現兩個模型沒有顯著差異,
則表示現有模型和飽和模型一樣好,也就是不需要用所有的X預測Y,只要用現有模型裡面的X就夠了!

但是,不知道的還是只能說不知道,特別是有些問題是實際處理資料時才會想到的問題。
例如:如何得知此迴歸模型的解釋變異量?到底那一個模型比較好?
當同學昨天問這2個問題的時候,我只答得出第二題。
可以計算兩個模型比較的deviance,如果查表的結果不顯著,則取X數量較少的模型。
第一個問題,因為則是今天上課的時候請教老師才得知的。
在羅吉斯迴歸中,沒有辦法得知R平方值以獲得可解釋變異量,但是統計學者以R平方的概念,
發明了偽R平方 (pseudo R square)。

偽R平方= [(-2logL)m-(-2logL)c] / (-2logL)m
L: likelihood
(-2logL)m:只有截距項的模型 (minimal model)的(-2logL)
(-2logL)c:現有模型的(-2logL)

偽R平方的數值的概念就近似於R平方。

其他檢定模型殘差的方法還有卡方和皮爾森適配度。
這就看所使用的統計軟體為何再看報表了!

為了解答同學的問題(下學期是論文十萬火急的時期),我因而把羅吉斯迴歸想得更清楚了!
謝謝她的提問。

8 則留言:

  1. 我週二提到類似概念,還記得嗎?

    回覆刪除
    回覆
    1. 是的。此處只是將pseudo R square的公式補上囉!

      刪除
  2. 回覆
    1. 我印象中您說羅吉斯迴歸也有類似R平方值的東西可以看。
      不知道您是指這個部分嗎?

      刪除
  3. 作者已經移除這則留言。

    回覆刪除
  4. 最近趕論文,對於電腦處理結果不是很明白如何解釋,請幫忙介紹可供參考的logression regression model課本,謝謝

    回覆刪除
    回覆
    1. 我之前上課用的教科書是Dobson, Annette J. (2002). An introduction to generalized linear models. Boca Raton: Chapman & Hall/CRC.
      我查了一下,這本書有2008年版的,有興趣可以找來看。
      希望對你的論文有幫助囉!

      刪除