※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

[爆卦] 民調計算全詳解

時間2023-11-19 17:29:20

最新2023-11-22 07:36:00

留言507則留言，348人參與討論

推噓204 ( 255推51噓201→ )

--------------------更新一下結論啦---------------------- 有推文說兩種問題是分開的，一個受訪者只會被問一個問題，所以把這種情況的結果也更新一下：柯侯對賴其中一項民調變不顯著： https://imgur.com/TYCen1W.jpg

侯柯對賴剩兩項民調顯著： https://imgur.com/jlvY4Ao.jpg

也就是說好幾個民調根本不用比，就是柯勝。 -------------------------------------------------------- 下面會直接分析結果，當然有些分析實際上要有原始數據會比較好，所以算是偷懶概算。那為什麼這次分析民調兩邊會吵成這樣，我只能說原因在於兩邊大概對統計都不熟啦，尤民眾黨那場記者會，套用的誤差根本是連大一統計的程度都沒有，如果國民黨跟民眾黨在吵誤差範圍時是用民眾黨呈現的誤差值在吵，那我只能說很悲哀。柯文哲整天說誤差3%就已經體現他統計底子不夠了，結果朱立倫記者會也在回應1.5%的問題，兩邊完全搞錯民調分析方法。一、原始表格提到的誤差怎麼來：首先要說，那個誤差計算適用的是白努力試驗，也就是答案只有支持或不支持、0或1的條件下適用的。我已經算過了，就看圖吧： https://imgur.com/LRgmD6w.jpg

這個公式計算的是在一個只有兩種結果的試驗下(例如拋硬幣只有正面或反面)，其中一個可能發生機率P(例如硬幣出現正面的機率)的正負1.96倍估計標準誤(也就是一直在說得 95%信賴區間的誤差)，所以他只代表了你抽樣估計比率時的分配分散情形，不能直接拿來代表計算跟其他比率做差異比較時的誤差。而且只適用N=1時的二項式分配(白努力試驗)。順便講一下柯一直在說得3%誤差怎麼來的。你如果要做民調而且不知道母群理論上得比率分佈(例如50%VS50%還是30%VS70%)，這時候根據以上公式(只有在2選1民調適用，其他把這概念用到所有民調上的，那都較做誤用)，在還算符合經濟效益又有在最保守估計下可達到還算可接受的誤差範圍就是3%，在最保守估計(P與Q代0.5時，便異數會是最大值)取得最低需要人數只要1068人，便可以在民調上確定取得估計誤差介於-3%~3%的成果。所以這個民調通說得3%本來就只是在考量經濟效益還可接受的人為選用值，他只代表你的估計有多少機率包含母體真實概率P，當然根據假設檢定的道理，脫離這個範圍的機率你可以視為不屬於此樣本而認為差異顯著，但是這種判定是在判定一個個體是不是屬於一個群體時適用，兩群體間的比率或平均數差異所使用的誤差是要轉換的。二、單問卷內差距分析：從新聞上分享的資訊看來，大概可以推估問卷(沒看過或聽過問卷只能推測) 施測方式：一個受訪對象回答A題：柯侯VS賴，你選誰？，然後B題：侯柯VS賴你選誰？也就是說A和B的回答屬於一種within subject的設計。而A題和B題內因為擇1，所以兩個選項的比率來自不同人，但是你每一個問題內不管你分成多少候選人佔比，他都是一個封閉的一組樣本，所以重點：1.所有人的回答對支持度的影響不會完全獨立，誰多了其他人就少、2.一般的檢定方法包含Z檢定和T檢定(與區間估計一體兩面)都是估計兩個樣本群體的差異，不適用在單題內侯柯/柯侯對賴的差距是否顯著。然後，昨天民眾黨說國民黨提然後國民黨否定有提出的2倍議題，這個標準只適用在一組樣本內只有兩個選項(Pvs1-P)的差異顯著性的判斷(像這次民調有兩個都沒支持的也不行)，完全不適用在A題和B題母數的比較，因為A題和B題的差值可以用兩個樣本群體做計算。如果真的要照民眾黨記者會公佈的先算跟賴的差距，再比兩種情境下的對賴差距是否顯著(差距的差距)，步驟應該如下： 1.將柯侯/侯柯的民調減賴的民調 2.透過以下公式計算差值的1.96倍標準誤：(統計一般來說，講到誤差值就是標準誤的值所以新聞吵什麼3%變6%還是說什麼3%誤差是指整個95%信賴區間的range，我只能說兩黨候選人和幕僚都回去翻一下大一統計課本好嗎？2倍根本不適用而且誤差值也不是指信賴區間的range)： https://imgur.com/8F1fv3t.jpg

為何用這個公式，請參考下面文章說明： https://abcnews.go.com/images/PollingUnit/MOEFranklin.pdf 推導請看這篇： https://reurl.cc/7MQboQ https://imgur.com/yCbybRb.jpg

https://imgur.com/BLV7VRs.jpg

簡而言之，你如果在單一樣本內有三種以上的分配比例，你要計算兩個候選人的差異應該考慮用多項式分配，避免誤用過於嚴苛的顯著標準(也就是純白努力試驗下的兩倍「P 的分配的估計標準誤」。符合多項式分配的前提是取樣數相對整個母群很小的情況，例如這次抽樣介於1000~2000左右，只佔全台0.01%內的人數，那原本是取後不放回的試驗可以當作取後放回來看待，所以單樣本如果跟這次民意調查一樣有三組比例分佈，那可以透過多項函數整合算出一個結果，根據這個前提可以透過考量共變數的公式將其中兩個候選人的差異問題變回二項式範圍處理，計算出兩候選人民調差異真正適用的標準誤。 3.計算結果確認跟賴有達到顯著差異的再來執行兩種情境的差異比較： https://imgur.com/VlxG9tE.jpg

https://imgur.com/SvV3Lo4.jpg

excel公式如下： https://imgur.com/mUkXw8H.jpg

https://imgur.com/AVcqpWU.jpg

結果顯示兩種情境柯侯和侯柯對賴都有顯著差異，但是其實從差距的效果量來看就知道柯贏比較多啦。三、跨情境(跨題)對比 1.民眾黨差距的差距較正確計算： https://imgur.com/wwtwfll.jpg

類似這張圖內在做藥物或處置效果對比的調整間接比較法，不過A題和B題各自內部差異是單樣本的不同候選人支持度差異，而不是操弄組對控制組視為兩個樣本群體。顯著檢定結果如下： https://imgur.com/fvPKiT6.jpg

我是用獨立樣本t檢定計算，公式如下(如果是我假定的抽樣方法應該要用相依樣本t檢定會比較適合，但沒原始數據，而我有兩種情境對賴差距的期望值和變異數，所以乾脆用獨立樣本的作法試算，在視為獨立下分析還能顯著，其實相依的方式分析也可以顯著，當然也可以用第二段靠估計的方法算共變)。其實柯幾乎可以當作輾壓。兩獨立樣本差異t檢定公式： https://imgur.com/Rv1QbPB

https://imgur.com/WS43GcS

Excel內公式： https://imgur.com/od3mV1n.jpg

2. 聽說國民黨的計算方式：好像就是類似單純比較法，不過這種方法很鳥啦，根本不用討論，完全無法反應兩種情境對賴的差距。建議： 1.其實檢定兩種情境的比例結構，應該可以考慮Chi square 改變顯著性的延伸：Bowker' s test of symmetry。 2.明明其他項佔比超大，請不要隨意用binomial方法算誤差好嗎？ 3.單樣本內不同候選人的支持度差異之標準誤計算早就有文獻在討論了，請多看。 4.題內比較一次再跨題比較，會遇到型一錯誤率膨脹的問題，應該考慮校正(此篇分析因為懶也沒有做) 5.這種分析全部當作抽樣有代表性，但是看公佈出來的結果，兩種抽樣方法沒看到加權調整的作法。 6.Confidence interval信賴區間實際上含意是指做無限次同樣抽樣方法和建構信賴區間的方法，這些區間有95%機率會涵蓋到母數，簡而言之就是你對建構這個區間的信心，現在常見的解釋「母數在這個區間的機率有95%」其實是反過來用，而且不一定牢靠，因為區間一建構完，實際就只有包含或不包含母數其中一種情況，就像刮刮樂會宣稱中獎率，但是你一但買了一張拿在手上，那張的結果就是確定的只有中或不中其中一個結果。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.1.101 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700386165.A.C72.html

民調

746[新聞] 快訊/難以置信！台灣民意民調:民眾黨支持

697[新聞] 最新民調！柯文哲31.9%超車賴清德「成第

674[新聞] NOW民調／總統大選三腳督！侯康配支持度4

626Re: [新聞] 美麗島民調／賴蕭配持續領先柯盈配觸底

571Re: [新聞] 民調／柯文哲年輕票重挫　侯康配猛衝「

507 則留言

→

gino071711/19 17:29, 1F

車都開走了你還在詳解123.194.162.12

噓

snsdakb4811/19 17:29, 2F

Too late220.136.21.136

推

omfg548711/19 17:29, 3F

==220.130.159.251

→

asdiii11/19 17:29, 4F

你知道已經要寒假了嗎?36.225.165.216

→

ziso11/19 17:30, 5F

這話題結束了拉111.240.150.74

→

StylishTrade11/19 17:30, 6F

還在帶風向阿瑞凡118.161.194.195

推

gn0169366411/19 17:30, 7F

請以20字總結，謝謝42.79.83.67

噓

anecam11/19 17:30, 8F

已經沒了在管1.161.97.200

推

aqlec11/19 17:30, 9F

已經不重要了223.138.40.15

噓

a2758867911/19 17:30, 10F

這篇需要想一整天嗎？180.177.33.135

推

PPPGGG11/19 17:30, 11F

= =今年是開統計學嗎122.121.68.54

→

douCai11/19 17:30, 12F

太長219.71.92.179

推

keirto11/19 17:30, 13F

還在吵民調喔，人家就沒再管統計，只想用223.140.140.36

→

makimakimaki11/19 17:30, 14F

end61.224.72.70

→

keirto11/19 17:30, 15F

會計做出他們喜歡的數據223.140.140.36

推

SidMax11/19 17:30, 16F

怎麼算已經沒意義了112.78.94.126

推

zoeapezoo11/19 17:30, 17F

KMT靠媒體說他們贏就好==101.12.46.23

推

IY122711/19 17:30, 18F

作業遲交算零分準備重修喔61.227.60.51

噓

paul1040411/19 17:31, 19F

直接講重點派誰選勝率大就好42.72.159.184

推

chubby3119011/19 17:31, 20F

慢了我們就不管了1.172.122.209

推

spring71911/19 17:31, 21F

https://i.imgur.com/BQU47oW.jpg223.141.225.209

推

xzcb200811/19 17:31, 22F

=.= 好了沒還要王俊多少人114.38.142.39

→

spring71911/19 17:31, 23F

這篇文章值1000p幣，respect!223.141.225.209

推

xyzc12311/19 17:31, 24F

也不重要了火車出發了自己買車票125.230.15.63

→

galleon200011/19 17:31, 25F

講重點36.227.95.43

推

guest200811/19 17:31, 26F

請問現在回去選修統計還來得及嗎？110.235.162.185

推

luckywind11/19 17:31, 27F

專業125.230.174.137

→

neil061111/19 17:32, 28F

下禮拜三再說223.138.203.164

推

salix11/19 17:32, 29F

沒有人在意要怎麼算42.77.115.30

噓

pkd2011/19 17:32, 30F

車都開了42.79.0.193

推

gvmlve11/19 17:32, 31F

好強！39.9.162.154

噓

roder11/19 17:32, 32F

考試都結束了你還在寫??114.24.218.238

推

asiaking556611/19 17:32, 33F

作業晚交就沒人看了下次請早111.82.62.229

→

k96060811/19 17:32, 34F

教授都走了你才交卷你要被當了150.117.33.111

※ 編輯: Psytoolkid (39.15.1.101 臺灣), 11/19/2023 17:32:42

推

Maniacs11/19 17:32, 35F

認真推慢慢看QQ88.130.52.232

推

puritylife11/19 17:32, 36F

太慢了吧昨天大家都交券了219.70.196.116

→

ppbro11/19 17:32, 37F

最後沒說重點可惡1.163.56.7

推

jganet11/19 17:32, 38F

1000p 要打多久阿42.77.197.184

推

stroy11/19 17:32, 39F

推114.137.181.22

推

blackhearted11/20 21:30, 514F

這知識水平太高了吧，文組真的有障123.195.205.8

→

blackhearted11/20 21:30, 515F

礙123.195.205.8

推

chulen11/21 11:59, 516F

期末考都考完了還在統計學詳解211.22.143.102

推

thelittleone11/21 12:26, 517F

這對板上智商來說太難了42.79.141.179

推

Vincent802611/21 12:52, 518F

太認真了125.229.223.87

推

jccy11/21 18:16, 519F

因為選舉讓大家都上了一堂統計課~42.73.79.26

→

jimlexus11/21 18:30, 520F

PTT雖然廢文多，但總有這清流文在支撐114.37.37.153

→

jimlexus11/21 18:30, 521F

下去114.37.37.153

推

kaeyo11/21 18:45, 522F

SPSSSSSSSSS123.195.150.44

推

Bluedemon11/21 22:31, 523F

推統計大師125.228.231.156

推

wszasdf11/22 04:53, 524F

ㄣㄣ跟我想的一樣12.226.201.122

噓

victor0lynn11/22 07:36, 525F

柯侯-3% 侯柯勝你們都在亂用統計 8736.239.249.170

Psytoolkid 作者的近期文章

-11Gossiping

Re: [爆卦] LIVE 民眾黨回應侯友宜重新檢視民調記

※ 引述《WuSam (藤原豆海)》之銘言 : https://www.youtube.com/live/6gaNMIg7xe0?si=_-7D6AbXBx0-6YHB : 針對昨天(21)下午國民黨總統參選人侯友宜 : 提出‘’重新檢視9

100Gossiping

Re: [爆卦] 民調計算全詳解

0Gossiping

[爆卦] 以色列為何不無辜PART1-前言及組織概覽

更多 Psytoolkid 作者的文章...