2018年3月9日 星期五

粉絲團談論人數與民調的驚奇異同

這幾天,公布了台南與高雄這兩個地方的民進黨內部的電話民調,雖然這跟真的投票沒有絕對關係,但做民調是很花成本的,當然除非有內參保密民調與對外公開民調外,民調還是很有效的 "政治工具"。

談論人數一直是很好的指標,尤其是在選舉的時候,因為選舉最後決勝負是得票數,而選戰不可能就是等著最後結果,也必須努力的讓聲量與認同度提高,所以最常見的方式就是電話民調。

電話民調的問題很多,但網路民調問題也是很多,所以我認為這兩個方法論雖然一致,最後跟的票數有正相關是必然,只是最後這個相關的差距在於 "誤差" 與 "轉換率",而在選舉這種分秒必爭的戰場,本來就不該輕忽任何資訊,想辦法在 "先驗" 的情型下知道戰況做判斷是必要的。

昨天在公布民進黨高雄市民調結果,恭喜 陳其邁 Chen Chi-Mai 出線,當時我看這數字雖然並不意外,也沒想那麼多,而剛有朋友問我今天台南市的狀況,此時我就很想知道高雄市電話民調有沒有辦法透過誤差與轉換率來推估。

因此把民調與這週平均談論數輸入,來算 "線性迴歸" 的 "相關係數",我預期應該是 0.7~0.8 之間,若低於這數字一定是有方法論的問題,但跑出來的結果立刻讓我嚇到吃手手,再三確認這數字沒問題,因為跑出來的結果是:

0.9911

通常相關係數大於 0.7 就可以推估有一定的相關,但 0.99 這數字已經說這兩個是一樣的結果,只有 1% 的誤差,當然這只有四筆資料,可信度表面是資料不足,但這個談論數是基於台灣平常有 1 千 5 百萬的使用者行為的結果,這個解空間不能說太小。


這數字一出來的確讓我嚇到,因為 0.9911 這數字真的是故意用 "做" 的也很難做成這樣,只是換來看台南市又是一個怎樣的狀況呢?結果更令人吃驚!

0.0310

這個數字代表的是不是正相關,也不是負相關,而是趨近於無關,這跟高雄的幾乎是 1 的正相關是天差地遠,為甚麼會有這現像呢?是真的頗令人玩味,但這邊提出幾點可能解釋。

1. 高雄慢慢變成一個商業都市,網路的普及率與接受度較高。
2. 台南有相當的人口還是在鄉村,使用網路接受訊息的狀況較低。
3. 王定宇是較為全國性的人物,不代表可以直接轉成台南市。
4. 黃偉哲的傳統插旗與廣告還是奏效?
5. 台南市的民調真的有所失真?

當然這數字有時背後意義很多,就像是在兩年前的立委選舉,雖然談論人數與票數的相關係數是 0.74 ,但每個政黨都不一樣:

畢竟這種結果常常決定於選民結構,雖然我認為這種計算方式雖然在全國性的選舉比較有意義,而六都市長通常具有相對的可信度,但其他縣市長與縣市議員的轉換度就應該很低,但沒想到一個台南市與高雄市就天差地遠。

接下來選舉越來越近,黨內初選的電話民調到底意義為何?或者是可以即時呈現的網路聲量該又如何看呢?雖然我們知道這些離選票不完全一致,但通常說,有聲量就代表有一定的支持度,除非打的是烏賊戰,此時即使高聲量也會變成負相關,或許這也是另一種警惕。

沒有留言:

張貼留言

熱門文章