2016年11月30日 星期三

實況投票的真價值

很多人以為實況投票只是一個浪費頻寬的工具, 雖然這是真的, 畢竟若只是一張圖, 上面就是幾個數字跳來跳去, 我真的不知道這是為了做甚麼? 況且這些投票, 本來就存在粉絲團本來的結構性偏差, 動員力量的問題, 甚至還有人把 "讚" 的選項做進去, 這不是刻意誤導或搞笑不然是甚麼?

當然目前做得最好的大概是蘋果的一個實況投票, 而背景不只是些數字跳動, 還有兩個子畫面來看立院會議現場與外面抗議群眾, 我覺得這是個再合適不過的實用案例了, 因為扣掉投票, 這兩個畫面本來就是個實況 (Live), 投票讓群眾更增加參與感是讓實況更加分.


當我看到一眼實況投票, 雖然第一直覺在想這還真的是白癡加搞笑的事, 是很有創意, 但就是浪費頻寬, 但我再想一下, 若這資訊不只是這些 reaction/emotion 的統計, 而是更有資訊多元的 "Dashboard/儀表版", 這個影片不只能夠讓人更輕鬆的看到事件的進行狀態, 而把大家的互動好好的整理起來, 說是能促進真正的討論也不是不可能?

當時就規劃了一下, 至少可以把這投票的狀況, 例如變化量做進去, 接著再想說能夠把留言討論的內容也做個整理就更好了, 以及把大家的頭像與立場整合進去不是更好嗎? 但這個月也是忙到上星期才稍有空檔 (或是擺脫低潮)....

只是真的要做還不簡單, 最簡單的的確是數字, 但要將之記錄做歷史儲存才能做分析, 而留言也是另一隻 API, 使用者的投票 (reaction) 又是另一隻 API, 將之搞定還不算困難, 困難的是這要如何在有限的資源去做即時分析, 這個就是須要一堆中間表與流程了..

最後在上星期的確整理出個 API 了, 只是畫面的呈現又是一門專業, 這的確不是我的專業, 因此在最後的成品前, 我還是要做一些測試與原形 (Prototype) 來做示範, 這些也是在上星期完成, 而我利用別人的投票結果來做測試的確是沒問題, 但要真的自己跑一次流程, 還真的沒那麼輕鬆.

而在昨天, 利用自己的粉絲團, 想了個題目, 就開始為這個打造一個實驗的投票, 雖然這個題目本來是要用在 "未來國會", 但因為太粗糙, 不好意思用那個粉絲團, 因此為了這個投票, 在原本已經完成的前 5 項還打造出第 6 項, 留言提到的人, 因為有時人是最容易聚焦的重點.

1. 投票即時資訊
2. 投票歷史資訊
3. 最近留言
4. 最近留言的人
5. 留言的內容
6. 留言提到的人物

但有趣的事是, 雖然我這次還沒有用任何的 Hashtag 或是特別的字來做判斷, 但已經有很多人順著題意加入 "不良" 這個字, 所以原本以為要去改變大加留言行為的想法, 似乎變成可行了, 因為不是用這種 "跳脫字(Stop Words/Escape Words)" 來做區別, 要用語意真的太困難了.

所以下一次投票就會叫妳在妳的留言, 加入 "喜歡/討厭" 之類的字做為妳講的事情是甚麼樣的想法與立場了.

說了那麼多開發的事, 回頭來講一下這種實況投票的真價值在於:

1. 即使沒有了投票, 也是有實況的價值, 投票往往是附加價值
2. 這個實況是種儀表版的概念, 能夠讓人更容易抓到這資訊觀點
3. 透過這樣的即時互動, 能夠有更帶動討論與想法的集結

雖然不否認的, 臉書對 Live 是較有刻意去擴散, 因為閱讀聽眾比較喜歡影片多於文字, 對於即時的事情多於已經過去的事情, 或許這種實況投票一下子已經被做爛了, 但或許這也是種打造未來媒體的可能性...

而新文易數最近開發的幾項功能, 也是為了創造出 "儀表版" 的實況去做開發, 就待下次的實驗了....

2016年11月24日 星期四

從網路工具來看 10 大政治人物的變遷, 是工具的變遷...

接近 10 年前的時候, 當時用搜尋引擎的網頁變化來判斷當時的 10 大政治人物, 跑出了這樣的一個表:

10 年後的今天, 利用新文易數及對應的臉書資料, 也跑了一個 10 大政治人物排行榜:



從排行榜來看, 剛好都在兩個排行上面的有馬英九, 宋楚瑜與陳水扁, 其他七個人都換掉了, 但我們今天討論的不是這些人, 而是系統的變化.

這 10 年的變化相當的大, 10 年前最主要的資訊來源是下面這幾項:

1. 網站的網頁數量
2. 部落格文章
3. 新興的網路新聞媒體
4. 搜尋量
5. 社群書籤

而在 10 年後的現在的來看, 最主要的變化是:

1. 主流媒體都上網了, 變成網路新聞的最大宗
2. 部落格文章大量減少 (很多平台都倒了)
3. 社群網站的使用者互動變成社群訊號
4. 搜尋量變得更難拿了
5. 社群書籤都沒人用了, 倒是社群媒體的文章變多了

當然最大的問題是有人會問, 這資料到底有沒有意義?

網路有一個有趣的現像: "nothing comes from nothing, nothing ever could", 也就是事出有因, 而通常這個因是因為相當大, 相當複雜, 所以有時找原因是困難的, 因此驗證的方式也是相對的困難....

尤其若是政治人物的聲量, 最容易被提及的是選舉, 尤其是預測的部份, 更因為時代的變遷有所變化, 在 2010 年之前網路的預策通常大部份的是用搜尋量來預測, 事實上有很大的落差, 還不如用傳統民調較準確, 而在 4 年前的選舉, 透過社群網站的訊息傳播來預測, 此時準確度就有很明鮮的提升, 甚至到 2014 年用社群網路的人際關係來預測, 投票數的準確率已經接近 7 成了, 而在今年的立委選舉, 甚至接近到 8 成的準確率.

畢竟人的思考是相當難捉模的, 有時顯而易見, 有時是很難掌握, 有時資料很明鮮一看只是早就已經知道的事, 但有時跑出來的結果又是令人意外, 這次的美國總統選舉更是一個相當有趣的實驗場所, 甚至更有趣的是用的工具方法說不定算出來的不是大家預期的, 但出來的結果反倒是準確的, 因為在這種大量選民的情型下, "因果" 已經很難用傳統選戰解讀.

雖然用 Voting Group 的選民結構來看, 是可以去左右政治, 但真正的政治是隨時隨地在發生, 不能只是在投票時才會存在, 才去感知, 才去監督, 所以在投票後, 投票時所用的這些工具, 也應該透過這些機制讓我們對那些政策, 或政治人物有實值的影響力與話語權, 而不是全部都從無法驗證的民調來得知民眾的想法.

像這次新文易數用的方法雖然說是很簡單, 就是從每天超過一萬篇文章, 去知道全台灣使用臉書民眾, 透過讚享評去知道大家每一個動作背後意義的改變, 進一步的計算出來, 這解空間幾乎是每天 16 億的可能性去組合出來的結果, 所以就速度與精確度是很夠的, 只是最麻煩的是只能知道結果, 無法知道因子, 除非再去做一次因子檢定, 只是這又是另一種工了.

只是一定有人問這如何得知或檢定呢? 畢竟這數量級這麼大, 又很難計算, 即使是公開每一個人都是有辦法去算, 但相對的基礎建設及處理能力是一個很高的門檻, 事實上包含我自己, 我也只能用一個方法:

這種資料並不是用來找出本來就知道的事, 因為人是相當厲害的, 就像是你看這些資料, 應該會覺得八九不離十, 但真正的重點是在那一兩成你看不出來的.

若這資料算出來跟大家預期的差很多, 通常不是計算錯誤, 不然就是方法論錯誤, 就像是我之前用林克傳說來看 "風向球" 時得到一個有趣的結論:

雖然網路聲量與正負評因為事件的發生而發生改變, 而任何有敏感度的人都會知道上升或下降的方向, 而跑出來得資料也是一樣的上升與下降, 只是到底是些微上升, 或是極劇下降, 人的判斷與系統資料有時會有兩三成的不一樣, 這兩三成就是讓我們檢驗我們不夠或未知的地方.

工具是死的, 人是活的, 透過網路工具讓我們看到沒看到的地方, 而不是讓工具去限制我們的思考, 這才是最重要的, 但發生不一樣的時候, 不是單純的拒絕, 而是要更進一步的思考, 就像是這次美國選舉那樣, 那些工具即使算出來答案是對的, 但真正的智慧是在人的解讀, 以及做為自己行為下一步的參考, 這才是資料的價值.

熱門文章