※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

Re: [討論] 數字冷冰冰,解讀一下公布的民調

最新2023-11-21 09:09:00
留言30則留言,18人參與討論
推噓7 ( 10317 )
剛剛在八卦回到新聞的文章被砍文且禁貼文了 在這邊重貼一次 誤差範圍是 3% + 3% = 6% 的說法在學理上也是錯的 要討論數字誤差,就要把數字當作機率變數來看才對 背景知識這裡有一些 https://web.ntnu.edu.tw/~algo/Number2.html\ 可整篇看完也可以查關鍵字“隨機變數的四則運算” E[X-Y] = E[X] - E[Y] Var[X-Y] = Var[X] + Var[Y] - 2*Cov[X,Y] ========== 謝謝 chordate 版友指正 Cov[X,Y]這個數字是 X 和 Y 的相關係,兩者愈相關則數字愈大 這裡的 Var 就是是數值的 Variance ,用這個可以決定誤差值 X 對應柯侯民調數字 Y 對應侯柯民調數字 那麼兩個民調數字的差值也就是 X-Y 而根據“學理”公式,Var[X-Y] 不只是 Var[X] + Var[Y] (3% + 3%) 而還要扣掉 Cov[X,Y] 而Cov[X,Y]最大值可以是 Var[X] 因為 X 是柯侯 Y 是侯柯 所以 Cov[X,Y] 會是一個很接近 3% 的值 所以 X-Y 也就是柯侯 和 侯柯的差距的誤差值會接近 0%,而根本不可能到 6% ※ 引述《TheoEpstein (Red Sox→Cubs→?)》之銘言: : 今天的民調,原始共有九份,有三份民眾黨要求不用,剩下六份是這六個: : https://i.imgur.com/qbkMxDX.jpg
Re: [討論] 數字冷冰冰,解讀一下公布的民調
: 第一個觀念「抽樣調查的誤差範圍,取決於樣本大小」。 : 這是統計學很入門的觀念。 : 所以全國調查時業界都會背了:「1068份問卷,基於95%信心水準,誤差為正負3%」。 : N是抽樣數(這邊就是問卷數),N越大,誤差越小。 : 這樣子就可以看懂上面那張圖的一部份「為什麼誤差範圍每一份不一樣」 : 誤差範圍最小的就是第1項的「匯流民調」, : 因為做到了2046份,N幾乎是別的民調的兩倍,所以誤差範圍只有正負2.17%。 : 誤差範圍這件事其實是科學,是統計,是沒有什麼好爭論的。 : 問題是解讀法。 : 國民黨的解讀法是,匯流那份 侯柯 46.10%、柯侯48.30%。 : 考慮到誤差範圍後是:侯柯48.27%~43.93%、柯侯50.47%~46.13% : 由於"侯柯的最大值,高於柯侯的最低值",所以這份民調「國民黨解讀為侯柯勝出」 : 民眾黨內參那份也是一樣的道理,侯柯 39.7%、柯侯 44.0%, : 樣本較少誤差範圍為2.98%,因此得到:侯柯 42.68%~36.72%,柯侯 46.98~41.02% : 這份民調照國民黨解讀,也是侯柯勝出。 : 不過比較怪的是世新那份,那份 侯柯 40.82%、柯侯 46.01% : 樣本少,誤差範圍為2.94%,可以得到侯柯 43.76%~37.88%,柯侯48.95%~43.07% : 世新這份也應該是侯柯勝出(柯侯最低可能到43.07%,侯柯最高43.76%)。 : 所以,若依國民黨方式解讀,結論應該是侯柯 6:0 ,不是 5:1 : 因為沒有任何一個民調是「誤差範圍算下去後,柯文哲有贏的」。 : 是說,「侯柯/柯侯讓誤差」根本就是穩敗,這個我當天就講了, : 到現在也沒人懂柯文哲為什麼會簽下去...... : PS. : 紅酒大師剛剛發文講到重點「國民黨居然蠢到讓六份民調全部公開」。 : #1bM4ICaK (HatePolitics) : 這六份數字攤開來,如果還是侯正柯副,那就是「讓民調低很多的人去選總統」, : 民進黨會樂到開紅酒開PARTY了。 : 甚至連國民黨內參民調都是侯友宜輸:侯柯38.2%、柯侯38.8% : (差0.6%,讓誤差後當然算侯柯贏) : 朱立倫到底在想什麼........ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.74.16 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1700312422.A.841.html

30 則留言

DustToDust, 1F
我們沒有討論那麼深入122.118.130.37
朱立倫不是說根據統計學上的誤差來當標準嗎 我就告訴他根據學理 誤差就是接近 3% 說 6% 的告訴我哪一本統計學或機率學是這麼教誤差值不管三七二十一直接累加的

Heyer, 2F
+-3%就是你要讓6% 就這麼簡單 不要揮49.216.17.131

tsubasawolfy, 3F
蔡正元有新算 差距-差距 的誤差值61.227.10.157

tsubasawolfy, 4F
不會是原本的正負% 會大概剩1/10正61.227.10.157

tsubasawolfy, 5F
負誤差61.227.10.157
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:06:25

Supasizeit, 6F
柯被高估3% 侯被低估3% 不就6% 常識203.204.194.135

Supasizeit, 7F
好嗎203.204.194.135

Heyer, 8F
差不多一點 剩下1/10不就快全輸49.216.17.131

thirtyto, 9F
科學 還是 柯學114.47.0.43

art1, 10F
讓 6% 有這麼難以承認嗎?XDDDDDDDDDDDDD218.173.19.73

chocoball, 11F
雙方快去找3年的期刊啦 看能否有新解180.217.115.206

chocoball, 12F
6%應該是教科書的算法沒錯 但就比較老180.217.115.206
我敢說沒有一本教科書在誤差直接累加之前 沒有加一個旦書 兩個數字要對應完全獨立的兩個事件 而這個旦書在本次應用中 不成立

strawhatandy, 13F
問就是要你讓6% 在那叫什麼123.193.178.58

jenchieh5, 14F
建議下周五開研討會 然後登記就過了114.38.100.234

Heyer, 15F
全輸我泱泱大黨不需要臉面嗎49.216.17.131
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:07:47

SHANGOYANYI, 16F
朱老師數學的教材跟你的可能不同1.163.120.224

zephyr105, 17F
笑死 開統計大會了223.137.249.215

zephyr105, 18F
然後統計版還是很冷223.137.249.215

chordate, 19F
你算錯了114.32.7.252
那你算給我看啊
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:20:03

chordate, 20F
是-2 Cov(X,Y)114.32.7.252

chordate, 21F
我重推導了一次 你是對的 抱歉
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:21:36
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:22:52

chordate, 22F

chordate, 23F
看Theorem 4.5.6114.32.7.252

ariesbreeze, 24F
如果是-2*Cov[X,Y],會不會相減值誤118.233.153.206

ariesbreeze, 25F
差甚至接近0%??118.233.153.206
沒錯 如果 X 和 Y 是完全相關事件 那麼 X - Y 就不用考慮會有誤差 因為 X 或有誤差 +2 而 Y 又跟 X 是完全相關 所以 Y 也有誤差 +2 相減之後 (+2) - (+2) = 0 也就是沒誤差

Fallenshit, 26F
以前的回憶都回來惹125.229.126.47
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:40:12

waitwind, 27F
推~114.36.18.109
※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 22:19:03

cvsi04236, 28F
你推出了統計系大一大二公式 然後呢?85.76.112.151

ecejc, 29F
然後就可算啦 不知道怎下手看這 #1bMJBJkb122.116.74.16

DJWS, 30F
我是原文網站維護人 公式的確少乘2 抱歉220.129.209.92

ecejc 作者的近期文章

Re: [討論] 剛李明賢說有錄音
※ 引述《eierom (非)》之銘言: : 剛政論節目李明賢講說,四人會議有錄音 而且 : 有關民調問題,朱提醒一次 馬又提醒一次,然 : 後李明賢說除非真的破局才會拿錄音帶出來還 : 原事實,滿有趣的國民黨 有有利的證據第一時 : 間沒
Re: [討論] 到現在還在凹6%
柯侯對賴時 柯侯的民調數字是 A, A 的誤差值平方是 sigma 賴的民調數字是 B, B 的誤差值平方是 sigma 侯柯對賴時 侯柯的民調數字是 C, C 的誤差值平方是 sigma 賴的民調數字是 D, D 的誤差值平方是 sigm
Re: [討論] 數字冷冰冰,解讀一下公布的民調
我直接講 如果現在真的不講什麼 3% 6% 而是咬死用統計學的誤差來考量 那麼柯根本不必讓到 3% 因為柯侯和侯柯的相關性很高 投柯侯不選賴的人 八成以上也都是投侯柯不選賴的人 那麼其誤差會變很小 可能剩 2% 或 1% 多 機率變數就是這
更多 ecejc 作者的文章...