2015年4月22日 星期三

[新文易數] 用自己角度來看新聞, 新聞事件簿的背後意義

網址: http://tag.analysis.tw/events/

[QOTD] 透過重組新聞讓選擇事件與議題交在讀者手上, 而不再是被記者或編輯決定, 或是被 "媒體財團老版" 指引.

從標籤的計數, 分數到計算被注目的爆發度, 進一步的透過等價標籤組成事件, 最後從時間的前後關係組成事件簿, 這路程走過來是相當有趣.

所謂的事件就是透過一群有關聯的標籤所組成, 目前每個時間點能夠切出有意義的事件約是在 30~40 件左右, 這可以在 "事件表" 看到.

但每個時間點 30~40 件事件跟下一小時(時刻) 的 30~40 件其事件與標籤的組合都是有或多或少的差異, 若是用標籤關聯來計算, 每次計算永遠是不一樣的, 也就是說每天若算 96 次, 就會產生 3000 個事件, 這是沒有意義的, 所以要把這每次所產生的組合, 依時間性再做一次組合才行.

在計算之前, 我當時猜測每天會有 20~30 個事件發生, 而其中有 10~15 件會持續到第二天, 也就是一半會結束, 用這數字來看的話, 會面聯到幾種參數可以調整:

1. 時間的連續性: 要多久當這事件關聯性消失才是下一個事件?
2. 關聯性的高低: 要多少比例的重合度才是相同的事件?
3. 標籤的集合: 要多少個標籤當作母體來計算重合度?
4. 事件要怎樣情型下才會組合與分裂?

最後自己想做了 N 年, 經過 N 個月的思索, 以及 N 個星期的規劃, 以及花了 N 小時做出第一個版本, 然後再花 N 天, 大改了 N 次, 以及小改了 N! 次, 總算是做出有意義的東西了.... (註: N 介於 5~10).

這樣就可以把每天有 10000(兩萬) 篇 的新聞組合出 30~40 個事件, 而我們在閱讀新聞的時候, 就可以選擇想要多看那不同的, 或者是多深入看些有意義的新聞, 以及跳過沒意義的新聞.

為甚麼會這樣說呢, 事實上台灣的新聞若是一天會報導 100 則新聞, 其中花了 50% 的版面與資源在報導約 2 則記者認為的重點新聞, 然後 25% 報導約 10 則的其他新聞, 最後的 25% 留給剩下的 88 則, 若是那 2 則, 或是  10 則是有意義的新聞就好了, 但通常這些都是假公義的新聞居多, 或者多是只須要很少的資源, 就可以聚集到很多目光的新聞, 甚麼深度與廣度就不是那麼重要了.

像現在英國藍今天就有超過 200 則以上的新聞,  估計一整天應該有 300~500 篇新聞講英國藍, 這數量就占了所有新聞的 5%, 而相同的大巨蛋也是有相同的數量, 也就是說有 1/10 的新聞在講兩件事, 這數字看起來不可怕, 但事實上有 9 成的新聞是搏不到焦點的, 也就是說在社群上一天能夠有 10 次以上的讚享評還不到 1000 則, 雖然說這兩則新聞也不是都能夠有 10 次以上的讚享評, 但有 500 則來爭取這 1000 則的名額就知道新聞的炒作是多嚴重了.

但我們知道記者不是故意炒作, 而是人本來就是健忘, 也容易被焦點給吸引, 記者也是人, 加上編輯也是人外, 更有其他因素的考量, 即使不是須要操作, 也會把目前的新聞變成不到幾件搏版面的事, 記得我在上個月的臉書寫到:

在 30 年前三台的時代, 因為政治氛圍的關係, 所以大部份的資訊都被屏壁, 能夠被三台說出來的觀點, 可能是 30% 還不到, 但相對的大家資訊來源也很貧乏, 一個人一天可以吸收 300 則新聞也佔這些新聞的六成了, 也就是一個人可能只接觸到約兩成的資訊與觀點, 八成的資訊都不知道.... 很慘....
但你以為 30 年後的今天, 大家能夠透過資訊看到更多觀點嗎? 事實上則不然....

由於現在有很多太多的媒體與太多的資訊, 雖然可以說已經有 90% 觀點的資訊都被寫出來與傳播, 只是這散佈在 100 倍的資訊, 也就是 5萬則訊息, 而人雖然吸收資訊的能力也成長了 10 倍以上, 就這數字來看反而人能夠看到的觀點只剩下 5% 而已, ....

你以為是這樣嗎? 事實上是更糟, 因為社交泡沫的關係, 你只看得到跟你思維較為接近的事情, 因此這效用讓本來就不平均的資訊傳播得更狹隘, 你只剩下能接觸到所有觀點的 60%, 最後你只看得到社會 3% 的觀點...

這些指的還是一般人, 若是你不幸的是在慈濟, 法輪功, 清海無上師這些團體, 這些團體所創造的資訊量, 早就超過一個人每天能夠吸收的好幾倍, 所以你接收到的資訊很可能只剩下這 0.5%, 甚至更低比例的人與團體所創造的訊息, 且因為你接觸的同儕都是這樣想, 所以你會認為這 0.5% 是這社會的 100%....

所以重組新聞是有必要的, 透過重組新聞讓選擇事件與議題交在讀者手上, 而不再是被記者或編輯決定, 或是被 "媒體財團老版" 指引, 只是這想法很簡單, 但做起來沒那麼簡單, 甚至我在去年以前認為這是難以達成的想法.


在這邊稍微說一下閱讀方法:

1. 初次時間: 這議題事件第一次記錄的時間
2. 最近時間: 目前記錄到最後一次的時間
3. 總時數: 上面兩個時間的差距
4. 最重要的標籤: 在這個時間的主要標籤, 其中爆發力分數最高的標籤與分數
5. 最後標籤: 當結束時產生關連的標籤
6. 小時 (過濾): 總時數超過一定時間
7. 分 (過濾): 依最重要標籤的爆發分數過濾
8. 代表新聞: 會選出一則代表這事件的新聞, 也就是標籤密度最高的新聞

其中最後標籤以後應該會用 "主要標籤" 來取代, 因為發現用最後標籤來算代表新聞似乎不夠準確, 但這就放進 Todo 了.

當做完這系統, 就可以做為新聞的導引了, 也就是真的我們接下來可以做出自己新聞閱讀與觀看的 "可控制與學習的搖控器", 所以說這只是個副產品, 或是必要關鍵一點也不為過, 只是做出這個副產品也太辛苦了點.

P.S. 有了事件簿, 我們可以套用在標籤上, 變成標籤的事件簿, 例如看 "賴清德標籤事件簿", 可以從時間軸來看有關賴清德的議題及重要新聞, 但相對的在對應標籤與重要新聞還是有再調整的空間.

沒有留言:

張貼留言

熱門文章