※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

[問題] 檢定殘差不呈常態

最新2023-11-19 11:47:00
留言43則留言,5人參與討論
推噓2 ( 2041 )
在做正式分析前,我想先檢測資料是否符合迴歸分析的基本假設 如果我判讀沒錯,目前資料符合下面假設 1.自變項與依變項呈線性 2.殘差保持獨立性 3.殘差呈同質性 但是殘差的常態檢定沒有過,呈現顯著 上網找了很久,沒有找到殘差非常態時該如何處理 (已用k-s檢定樣本呈常態分配) 請問有比較建議的處理方式嗎? 或是我在哪可以找到說明or教學? 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.20.146 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1700243165.A.20D.html

43 則留言

locka, 1F
好奇問個,有可能殘差獨立卻非常態嗎?

yhliu, 2F
當然可能誤差項非常態。(不是殘差,但誤差項是不可觀測的

yhliu, 3F
只能用觀測到的殘差代替。不過,殘差其實相互有負相關及變

yhliu, 4F
異數不等的問題。)檢定常態性,是把殘差當誤差來看待,用

yhliu, 5F
q-q plot 觀察,或做 W 檢定,或 K-S 檢定。

yhliu, 6F
對於誤差項非常態分布的處理:如果是線性模型(迴歸模型)

yhliu, 7F
如果樣本數相當大,可以引用中央極限定理於迴歸係數的推論,

yhliu, 8F
或者針對其真正的分布導出 MLE 及迴歸係數之推論。迴歸模型

yhliu, 9F
之比較也是迴歸係數推論。廣義線性模型(link=identity)即是

yhliu, 10F
採用的是最大概似估計及概度比檢定。但如果只知非常態而不

yhliu, 11F
知正確分布,又不想用普通最小平方法,那可能需要用非參數

yhliu, 12F
化方法,也就是無母數方法。

a22735557, 13F
除非違反的很誇張,例如skewness kurtosis 差很多或是

a22735557, 14F
不明顯滿足empirical rule,不然通常還好,原因同樓上

a22735557, 15F
大大說的,residual 本身其實變異數就不同質等等

a22735557, 16F
我是建議不要用K-S直接下結論,因為這個檢定其實蠻難

a22735557, 17F
不顯著的,他的要求很嚴格,差一點點就可能會不顯著

locka, 18F
感謝2樓大大說明!我知道殘差(亦或誤差)是可能非常態分佈,

locka, 19F
但想問的是殘差有可能在「已知獨立」的情況下但卻「非常態

locka, 20F
」嗎?(以前都以為只要獨立就一定會是常態分佈…)有點想不

locka, 21F
明白,再請大大解惑,謝謝>"<

amberclover, 22F
感謝大大說明,為了這個超級煩惱. 再次感謝

Pieteacher, 23F
Boxcox transform

yhliu, 24F
比如說 logistic 迴歸,Poisson 迴歸,前者每個觀測值不是

yhliu, 25F
0 就是 1, 後者觀測值是計數資料,與迴歸曲線之間就群體模

yhliu, 26F
型而言有誤差,就樣本值而言有殘差。殘差因為迴歸線就是這

yhliu, 27F
些資料去 fit 的,所以相互有相關;誤差則是觀測值與群體迴

yhliu, 28F
歸函數之間的差,觀測值相互獨立,誤差只是各觀測值減去一

yhliu, 29F
個理論上的期望值,當然還是相互獨立,但這些誤差怎麼可能

yhliu, 30F
常態分布?更別說要假設它們是 i.i.d. 常態。事實上如線性

yhliu, 31F
模型的 "誤差是 i.i.d. 常態" 只是一個分析者設立模型時的

yhliu, 32F
假設,這假設是否為真有時候需要檢驗,這就是殘差分析的項

yhliu, 33F
目之一。殘差是群體模型誤差項的替代或估計,因此從各種殘

yhliu, 34F
差圖可以看出很多東西,如迴歸函數適當否?誤差變四是否為

yhliu, 35F
常數?誤差項是否符合原假設的常態?有沒有離群點?是否有

yhliu, 36F
些影響點需要特別注意。關於誤差常態性的檢查,通常看 qq圖

yhliu, 37F
W 檢定與 qq圖密切關聯,至於 S-K 檢定,其實它比較適合用

yhliu, 38F
在不需估計參數的資料,Box-Cox 轉換雖然可能改善誤差項的

yhliu, 39F
態使其較趨對稱也較接近常態,但也改變了迴歸函數式及相加

yhliu, 40F
性結構,但如果樣本不是太小,殘差顯示誤差項分布不是太偏

yhliu, 41F
則關於迴歸係數的推論,t 程序,F 程序就不用太擔心。

yhliu, 42F
前面 誤差項變異數 打成 誤差變四 .

locka, 43F
謝謝yhliu大大!非常清楚!!