2014年12月30日 星期二

從大眾媒體與社群媒體熱度比較來看後面那隻手?

有人知道我算是野百合學運的那一代, 在那場洗禮, 讓我深刻感受到三件事情:

第一件事就是電視新聞報的跟事實差很遠
第二件事就是報紙所說的千萬不要相信
第三件事就是雜誌文章多是胡說八道
而我在那時之前也一直跟很多人一樣, 認為會有一個 "中立", "客觀" 的媒體, 但後來慢慢體認到, 任何媒體都有 "立場" 與 "觀點", 因此想在一個媒體追求中立客觀是不太可能的, 我們只能透過很多很多不同立場與觀點的媒體, 綜合起來才能嘗試著接近 "中立" 與 "客觀".

所以在 "樂生事件" 之後, 我一直在思索能否透過社群媒體來跟大眾媒體, 而在嘗試很多次之後, 終於在 2008 年利用部落格觀察做出 "部落格好好讀", 透過部落格來看社群媒體的熱度, 也做了幾次有趣的觀察, 如: "台灣媒體的對立現像", "好好讀的藍綠對決? 看馬英九與陳水扁".

只是很不幸的那時候主流大眾媒體對網路還是不理不睬, 不要說是看扁網路媒體, 更是敝藪自珍的保護自己, 而接下來幾年, 發生甚麼事大家都知道, 不只是傳統媒體紛紛上網, 甚至還有原生的網路媒體及內容慢慢掘起, 相對於傳統媒體紛紛落馬, 到現在很少傳媒不會不在網路做露出了.

而一直到做林克傳說時, 也嘗試很很多次去用系統計算與監督衡量傳媒的計劃, 也做過很多次社群媒體的採集, 例如噗浪, G+, 但最後台灣目前最大宗的是臉書 Facebook, 因此林克傳說也是透過臉書去看社群如何看媒體這件事.

經過一兩年的調校, 透過林克傳說已經可以解讀不少社群媒體的資訊, 若是能夠把大眾媒體這塊給連結起來, 當時的計劃就有初步的實現, 只是抓資料並不難, 真正困難的是訂定 "議題", 而這部份真的只靠語意分析是困難度很高, 而當時部落格好好讀用的是 "搜尋關鍵字" 做種子, 而大眾媒體要用甚麼做為基礎也想了很久, 一直到最近, 認為採用各家媒體 Tag (標籤) 的使用, 就是很好訂定議題的方式.

標籤是一個很具有記者面對採訪對像的出發點意義, 加上分類觀點的整理, 跟使用者導灠與搜尋的情境等等的功能, 就是一個很好的議題定義方式, 透過這樣的延伸, 此時就可以做出一個知道這個議題在大眾媒體的熱度, 加上與林克傳說社群媒體熱度的串接, 就可以一目了然這議題的屬性, 是否在大眾媒體或社群媒體過熱或過冷.

最後做出像下面這樣的表格系統, 目前暫名 "雲標籤":

從這些就可以看到這個議題在大眾媒體與社群媒體冷熱的比較, 而也嘗試著做了一些數字的正規化, 來保持一致性來做比較, 因此也是以接近覆蓋率的熱度來做基準, 因此也是種百分比, 但相對的大眾媒體相較社群媒體是比較少樣本數, 變異度不像社群那麼高, 甚至在議題的分布都是相當平均, 不像社群媒體高低落差是相當大的.

當然接下來能做的還很多, 例如跟 Google 新聞做比較, 或者是直接對所有新聞內容做搜尋, 定義出熱度都是很不錯的參考值, 但至少透過這個 "新聞標籤雲" 的系統, 可以很輕易的知道這議題是那家媒體在炒作, 但倒底這差距是因為記者的專業與道德, 還是因為業配或是被收買, 這還是要靠大家自己的解讀, 畢竟這只是種輔助工具, 答案還是要靠大家去尋找, 只是更希望大家透過這系統認知, 閱讀新聞並不是照單全收, 還是須要我們讀者去做判斷才不會誤讀.

2014年12月17日 星期三

如何提升網站 CTR 的思考架構學

在 Search Rank (SEO) 納入 Users Signal (使用者訊號) 之後, Click Through Rate (CTR) 變成了一個不在只是 UI/UX 的最愛, 更是 SEOers 不得不提的事了.

當然 CTR 不是只有注重 SEO 的人才須要注意, 而是每一個網站經營者都須要認真思考的一件事, 記得在很久以前有一個我認為很重要的準則:
在每一頁都須要有一個你最希望, 或你認為使用者最有可能會點的一個連結, 然後給明確標示出來讓使用者清楚的看到去點擊.
只是在大多數的情形下, 若不是透過個人化的資料探勘或行為預測, 真的很難算出或知道使用者真的想要的, 所以最後只有設定一個最顯眼的圖示, 就是經營者想要的, 通常就是 "發表/回應文章", "放入購物車/結帳", 這些事情, 但就真的是這樣嗎?

當然也不是不可能真的幫使用者算出他最有可能要的東西, 就像是在之前一篇文張提到, "九項如何建立有效商品推薦系統, 所須要知道的進程導引與架構指南", 裏面就說了: 分類系統(標籤系統), 排行榜, 分類排行榜, 消費者背景 (因子分析), 關聯分析, 多次關聯分析, 語意網路, 社群訊號, 個人單品預測都可以做為使用者最有可能會點擊的選項.

但說了這麼多, 還不如請大家去看 "Ambient Findability 隨意搜尋" 做為基本常識, 雖然這本書是寫於 2007 年, 裏面不少已經過時, 但是很多精神都還是可以學習的, 只是現在或許若是追求 CTR, 又是一種不一樣的境界與出發點的不同, 但最後很多是大同小異.

而在這邊用一個簡單的思考模式讓大家在做網站時, 如何提高 CTR 的思維心法, 也就是一個思考的架構, 讓你去找到使用者想要的線索, 而網站要提升 CTR, 就是隨時隨地把這線索提供給使用者就對了.

我們可以想像使用者到網站之中探索, 一定會有其方向, 我們把方向定義成八維, 就是上下左右前後內外的四軸, 這四軸的八維代表的行為是甚麼呢?

1. : 當使用者發現這頁的資訊是他要的, 但只是所想要的一部份, 所以會嘗試著提高視野, 也就是更巨觀一點的角度, 此時用麵包屑就可以讓使用者知道這網頁的層級, 往上一層就可以找到他要的資訊.

2. : 相反的使用者發現這頁的資訊雖然方向對了, 但不夠精確, 此時就可以透過次分類或結構化條件, 或此類別下的搜尋找到往下層的 "Refinement", 通常也可以用 Tag Cloud (標籤雲) 或關聯分析做到, 雖然這個往下跟上不一樣, 上通常只有一條, 但下有很多種可能性, 當然若是 Network Relation (網路關係) 而非階層式又是不同, 只是前題是要有這樣的既有資訊, 或者是去建立.

3. : 左右的意思是指同一層級的相似性, 在這邊區分成一種是整體的, 一種是個人的, 整體就是可以參考大家的共同行為, 例如像排行榜就是一種共同行為下聚合 (聚焦) 的結果, 當然很多關聯式分析 (Relation Analysis) 也是種精過專化的結果, 像所謂的關聯購買 (Also Buy) 也是很好的提升 CTR 的想法.

4. : 若是能夠預測出一個人偏好, 或者是算出一個人的行為機率來做其參考, 甚至真的用個人的行為專化出推薦, 這往往是最 "好/Right" 的 CTR, 甚至在看到此內容頁或商品時, 會讓使用者更願意在向前點擊時能夠看更多的東西, 勸敗更多, 若這是種 "專屬" 性, 甚至是會 "結束" 的話是更好, 最近我看過中做得最好的大概就是像 Steam 的 "探索佇列".

5. : 當然下一步往往是經營者最想要做的, 無論是放入購物車或是發表文章, 但也可能只是漫無目的瀏灠下一篇或下一個品項, 重點是不要讓使用者一口氣看到 50 個以上的連結, 且都沒有優先與重要性, 這是最糟糕的.

6. : 但最常見的是使用者想要回頭看的機會是相當高, 且有時只是靠 "上一頁" 或 "回首頁" 是不夠的, 因此有些網站會加入 "最近瀏灠" 的清單, 這都是不錯的主意, 至少要讓使用者對自己過去的行為有跡可循, 甚至透過這樣的回溯找出新的叉路, 又提升 CTR 了.

7: : 通常這邊可以定義成 "More/更多", 如何讓這頁的資訊更多, 變成一種類似 Aggregation (聚合), 甚至是 Portal (入口), 創造出很多跟此頁的相關資訊, 或是能夠讓使用者把這邊是種內部的中心, 去探索, 做出好的決策, 通常不用太擔心負面資訊, 因為嫌貨總是買貨人, 就怕他不再去想要知道更多.

8. : 網站最怕的當然就是 Exit Rate (離開率) 太高, 或者是直接的 Bounce Rate (跳出率) 不再回頭, 所以若使用者真的不知道自己要甚麼, 就想辦法讓他去 "Search/搜尋", 無論是有建議的, 或結構化的搜尋或是全文搜詢甚至同性質網站的建議, 如何讓使用者有好的 User Experience (UX), 這是讓使用者繼續留下或再來的重要因素.

寫到這邊, 就直接乾脆把這方法稱為有點俗套的網站八卦陣 (感覺是在賣膏藥), 但在某方面也是如此, 透過這種思考, 能夠更包覆使用者的須求, 就能夠讓使用者更願意留下來, 就能夠增加 CTR 與 TOS (不是 The Original Series).

只是這八點看起來很簡單, 事實上有幾點要實作不是那麼簡單, 可以去看看你經營的網站已經有那些維度或者是還缺那些維度呢? 但透過這樣的思維, 會不會覺得更貼近使用者一些了呢?

2014年12月15日 星期一

從 Google Analytics 網站分析元素看電視收視率

網站經營最基礎的就是看網站分析, 而網站分析最常用的就是 Google Analytics, 透過網站分析的使用者行為, 可以做為經營網站很重要的參考, 一個初入門者, 通常至少要了解 GA (Google Analytics) 的 20~30 項元素的意義, 一個較為進階的管理者通常要知道 50~100 個 Dimension (維度) 與 Metics (指標) 所建構出來的報表, 事實上目前 GA 就 Core Report (核心報表) 的維度與指標已經有 424 項以上, 且隨著經營的須求一直在增加.

為甚麼要那麼認真呢? 一個網站每一個點擊都是有意義且可被計價的, 所以必須對使用者的行為錙銖必較, 因為若能對網站使用行為了解越多, 越可以去讓網站更去優化, 透過這樣的進步若能讓使用者更願意使用者使用網站, 收益自然越多.

當然建置一個網站的成本跟電視節目是很難比較的, 有成本很高的網站, 也有成本很高的電視節目, 但扣掉帶狀節目的觀點, 最大的差別就是網站一做出來就是經營的開始, 相對的電視節目做出來, 內容就不會改變, 就很難從優化的角度來看電視節目, 只是這是以單一電視節目來看, 以節目的經營來看, 現在已經很少不是帶狀的節目, 此時若不更去了解使用者的意向, 這種投資很容易是漫無目的, 甚至是瞎子摸象, 所以電視節目就須要 "收視率報告" 來幫忙.

只是我們回頭來看現在的 "收視率報告", 不要說是跟網站分析比起來是 100% 無抽樣全體資料搜集, 收視率的樣本通常是連 0.1% 都不到 (目前約是 0.02~0.03%), 其元素 (維度與指標) 全部不超過 20 個, 相較網站分析超過 400 項幾乎可以說是簡報的大綱, 此時來去套用在廣告價格動輒百萬的觀點來看, 真的是相當粗糙, 當然這是有原因的, 因為電視廣告的賣法就是只看收視率, 這是廣告代理商長年 "教育" 買主的結果.

或許也就是因為網路廣告的計價, 是可以到很精確到每次的 Click (View), 透過機制架構很精確的以算出來, 而電視的廣告主要是透過業務的報價 (或是漫天開價), 最後只要交出一個半分真半分假的結案報告, 其樣本數與題目說不定比收視率更模糊, 最後只要業主願意買單就好, 所以廣告界產生一個有名的笑話:

"我們知道廣告有一大半都是浪費掉, 問題是我們不知道是那一半"

但若真的廣告看的是目前收視率的報告而言, 也只能如此, 但事實上以現在的角度來看, 收視率應該可以更進化, 不只讓經營者 (電視節目製作者) 更了解觀眾的想法, 廣告買主也應該更可以知道使用者是如何看的, 甚至我們可以嘗試著以 "網站分析 (GA)" 的元素來思維電視收視率要如何改善.

網站經營有七大項數字, 在某方面是可以嘗試著去延伸電視收視率的基礎:

1. Sessions (Visits):  訪客數在某方面可以說是使用者有到過這個電視頻道的數目
2. Users: 使用者數可以成為有真實的觀眾總數
3. PageViews: 點閱數大概就是這節目的總時數
4. Pages/Sessions: 平均點閱數幾乎就是目前的收視率
5. Avg Session Duration (Time on Site): 在網站時間可以比喻成每次轉過來看的人會停留多久
6. Bounce Rate: 可以定位成在下次廣告節目結束前就轉台的機會
7. % New Sessions: 有多少個新使用者, 這可以定義成第一次來此節目或是只停留一次的人比例

從這邊來看, 似乎收視率的變化就多很多了, 且都有相當的意義, 再加上既有的 Dimensions, 如性別,  年齡, 收入, 等等的維度, 那變化就可以更多了.

事實上這些最大問題在於收視率不單純只是收視率, 更重要的是收視者的變化, 尤其是轉台, 回訪等等的動作, 甚至以賺取更大的 "覆蓋率 (Coverage Rate)" 或廣告效用 (透過 Turn Over Rate/Bounce Rate) 的方式來去對廣告或電視製作有更好的效果與參考.

以現在的機制與技術, 要做到真的 Realtime 即時分析不是難事, 只是這背後有很多機制與運作, 尤其是目前我們習慣是用 "節目" 做為切割單位, 事實上有時是不夠的, 甚至應該是用其 "Highlight" 也就是某些時間的爆點, 來去看這些數字更有意義, 只時此時就要經過建立 Timestamp (時間點) 的 Meta-Data (後設資料/元資料), 就可以去找出某個節目, 或某個活動 (轉播) 或是脫口秀的精華, 只是這又須要進一步的開發. 

圖源: OVO!台灣電視讚起來

從勞動局長的警示來看佔中真普選的啟示

[QOTD] 圈選的制度, 事實上只是讓符合既有體制的人去維護既有價值, 跟人民想要透過選舉來 "改變" 是不一樣的, 這次台北市勞動局長的選舉若不是有人退選, 人民就完全無法選到要選的人, 從這就會讓我們目睹與預測未來香港選舉的悲哀......

在台北市勞動局長塵埃落定時, 大家也在這次很有 "時代性" 與 "實驗性" 的局長 "選舉" 看到不少政治的事實, 尤其是:

1. 原本呼聲很高的候選人連前 10 名也到不了, 雖然號稱是第 11 名.
2. 10 個人中, 評價最高的人, 也被前 5 名刷下來, 最後是因為有人棄選或除名得參選
3. 最後獲得最高票的是原本無法參選的人

從這個 "教訓", 真的可以 "借鏡" 出香港佔中的真正原因, 因為就政治的運作下, 最後人民往往沒有辦法選擇真正想要的, 而是在一群 "相似度很高" 的人作選擇.

但為甚麼會這樣, 也不完全是陰謀論, 雖然不否認這樣 "遴選委員" 一定會有 "偏差", 這偏差或許不少是有私心或不可告人的秘密所產出來的結果, 但更多的原因是所謂的 "專業者" 的機制, 有時跟大眾的評價不太一樣, 甚至會產生悖離的結果.

有人說, 若這次台北市市長的選舉, 若是有下面幾個候選人該如何?

1. 連勝文
2. 丁守中
3. 黃昭順
4. 蔡正元
5. 羅淑蕾

若是評選標準是: 有良好的政黨經驗, 有其他政府官員的經驗, 有議員或立法委員的經驗, 等等為優先考量, 此時, 一個只是當過主治醫生的參選人有可能會被遴選出來嗎? 我想應該也是在 10 人名單之外, 更不要說有機會進到 5 人名單, 像這次一樣.

這次若是勞動局長的遴選標準是:

1. 有勞動局處等相關經驗
2. 有工會理事長相關經驗
3. 有勞資相關的論文或教授
4. 有上市公司人資或董事相關的經驗

我想應該也沒人會否認這幾個標準看起來光鮮亮麗, 不該是遴選標準吧, 至少是相當 "安全(Safe)" 的標準吧, 但若這是個基本標準, 來看蔡瑞麟與賴香伶, 落選也不會意外.

但此時就會發生一個相當矛盾與悖離的問題, 真的所謂專業的評量, 即使沒有陰謀論, 最後圈選的結果往往是:

1. 最沒有變異的名單
2. 最安全的名單
3. 最有關係的人出線
4. 最有知名度的人出線
5. 最有資源的人出線

只是這真的是人民所要的嗎? 甚至在沒有 "變異" 的結果就是這幾個候選人看起來是同質性相當高的, 也就是最後對既有的政權下最 "安全" 的結果, 即使遴選委員不會這樣想, 但最後還是 "最有資源" 的人出線, 而最有資源與關係的人, 就是本來就依附在既有體制運作下的人, 所以要有一個 "不一樣的候選人" 是不太可能的, 也就是說後面的 3, 4, 5 就是既得利益者或是了解與運用既有機制者也不為過.

所以圈選制的確不是一個好的 "民主" 的示範, 當然若這是種 "階段" 或是 "權宜" 之計, 並不是不可以, 但若是把這制度貼上一個 "民主" 的橡皮圖章, 是真的很危險的, 因為民主的價值在於 "選擇", 這選擇是種落實 "改變" 的意念, 而若是用圈選的方式, 是達不到這種概念的, 因為最後的候選人都是既有系統機制的 "精英", 這些人是不太會去 "改變" 的.

因此這次的勞動局長不只是對社會是正面的, 因為讓人民的選擇變多了, 這是好事, 但千萬不要認為這是真正的民主, 只是這次的經驗, 更可以讓台灣人民了解香港人民要的是甚麼, 因為台灣人可以選市長, 選總統, 若能夠 "改變" 最高的領導者很多事情可以 "改變", 但香港人民只能默默的接受當權者的宰治, 連說不要的機會也沒有, 或許這樣的經驗是更可以突顯的.

最後, 我甚至相信這次勞動局長的遴選委員是真心的, 用自己的經驗與專業, 選出自己認為對人民最好的候選人, 甚至是自己, 只是他們沒有想到, 他們選出的不是 "五個候選人", 而是 "一種候選人", 也就是跟遴選委員想法 "最合" 的人, 並不是人民要的人, 此時人民也沒甚麼好選的不是嗎?

2014年12月3日 星期三

及格的網路選民, 不及格的候選人

很多人把這次大選關鍵因素定調在網路世代的獲勝, 這的確是真的嗎?這句話有對有錯, 因為的確是網路改變了大選的結果, 只是不是候選人造成的, 更不是民進黨造成的.

在選舉前一天, 我貼出 "台灣社群排行榜" 下有關 "選舉與候選人" 的排名, 用的是這 150 天以來的資料, 這些網站, 是包含競選官網, 部落格, 還有其他為了選舉而做的網站, 包含沃草與 PTT 等的網站, 前題是有獨立網址, 所以一些媒體做的競選專欄是不在其中, 但這 5 個月下來, 能夠獲得到 1000 個以上臉書的分享只有十幾個.


也就是說, 這次的選舉網路影響的不是候選人, 而是網路自己本身, 其中最重要的是兩點因素:

1. 網路人透過社群網站去選擇, 過濾與閱讀資訊, 不再受制於傳統媒體的 "挑選"
2. 網路人自行產生很多內容, 並透過網路傳播發揮影響力

這在以前, 包含 2 年前, 雖然很多網路人都嘗試去做, 但最後都失敗, 也是有原因的, 主要原因有:

1. 社群網站開始發揮影響力, 尤其是臉書
2. 網路製作開發平台的成熟
3. 大眾媒體因為資源不足, 必須從網路社群獲得資訊
4. 318 之後, 網路被社會大眾重視

但這代表候選人已經開始透過網路去打一個網路上的選戰嗎? 如同前面所說的, 從真正資料來看, 稱得上使用網路的候選人, 只有 1.06 人, 這邊是 1+0.05+0.01, 也就是柯文哲, 連勝文, 與 0.01 的其他人.

這樣說也是過於扭曲與片面, 但就事實上就是如此, 真的有主動或被動發揮到網路影響力的, 是少之又少, 也就是說這 2 萬個候選人, 只有 1.x 個人真的有意識到網路, 且真的去做, 甚至發揮到效用, 其他絕大多數的人, 在網路多是順勢的利用對他有利的局勢而已, 說是真的有開創出甚麼的, 除了上面三個人, 我知道像童仲彥等幾個市議員, 及幾位新竹市長候選人, 已經踏出一步, 雖然這一步踏出去了, 但最終能見度還是有限, 不然從社群的觀察不會那麼慘烈.

包含一些小黨, 很多都是從草根社會運動出身的, 說要對網路有足夠的熟悉度還有段距離, 再加上資源不足就更不用說了. 而在這次候選人中, 有兩位本來就對網路有能見度的, 就是林群森 (獨孤木) 與 王浩宇 (Xavier), 而很不幸的即使期待這兩位在網路上有足夠的表現, 但林群森在選前中風, 很多事情都無法做, 而王浩宇也是走傳統的選站, 網路的動作不多, 最候在網路的表現雖然不是白卷, 但也是沒幾分.

而到底要如何拿高分呢, 或者換句話說, 怎樣才是及格的網路候選人呢? 這邊大約列了 25 個項目, 若是有做到, 可以獲得 1~4 分, 來請候選人來自評總分可以獲得幾分呢?
  1. 建立網站
  2. 建立新聞或部落格 (可輕易增加內容)
  3. 建立功能性系統
  4. 有時間性資料
  5. 有地點性資料 (如行程)
  6. 電子報
  7. 使用臉書粉絲團
  8. 使用影音來輔助
  9. 會員登入
  10. 社群登入
  11. 可直接捐款
  12. 可購買競選或文創商品
  13. 選民可以回饋
  14. 選民之間可以互動
  15. 社群網站經營有成果
  16. 建立附屬支援網站
  17. 內容釋出
  18. API 釋出
  19. 讓選民表態
  20. 投票動員
  21. 非網路選民動員
  22. 透過系統搜集網路意見
  23. 搜集網路意見成政見
  24. 使用其他網路平台製作
  25. 候選人直接使用網路
我想應該沒有人懷疑這次柯文哲可以拿下最高分, 且只有他及格, 而連勝文應該也可以得到不高的幾十分, 但其他都是在 20 分以下吧.

我想應該沒有網路人認為這 25 點那一個不重要吧, 而要說對於競選經費不到百萬的人去要求或許是過高, 但要達到及格分數, 重點不是經費, 而是心態, 因為有些成本真的不高, 只要肯用心去做, 無論是自身或是競選團隊來協助, 並沒有那麼難, 只是在於有沒有這認知與決心.

就像是這次連勝文的網路部一開始似乎很有心, 但最後不知是也被切割還是如何, 難以發揮效果, 雖然有人說的確是這次國民黨網路選戰有在動的, 只是若是不去擁抱網路公民, 只是把網路當宣傳管道, 最候只會越離越遠, 其他更不用說了.

而扣掉無黨籍的柯文哲, 民進黨也沒交出甚麼可以看的成績單, 除了我們熟知的比利潘潘醫生所做的柯P 新政有發揮到效果, 但這個算不算民進黨的成績單我就不知道了, 而在前十名的還有民主小草, 這是否要算到黨部的功勞, 因為我也不是民進黨員, 更不會知道了.

接下來的 10 名之外, 不用說這三個也都落選人, 以這表面的角度來看, 這次的選舉, 真的是 "網路公民" 有參與到這個社會, 但只有個位數的候選人參與到網路, 從這角度來看, 真的要對柯文哲 "市長" 加分.

只是最後更期待的是未來的社會所有事, 包含政治, 透過網路能夠更 "透明", 能夠更 "雙向互動", 甚至更應該說, 從現在開始, 我們更要透過網路來談政治, 因為不談政治, 只會讓政治更不透明, 更為被少數人操弄, 也因為讓我們繼續透過網路來談政治, 這社會能夠讓更多的公民參與政治, 這樣政治才有機會從黑轉白, 更接近我們真正想要的政治, 不再只是權貴的政治.

期望這天的到來.

2014年12月1日 星期一

在未來從網路大數字就可以知道當選的可能性 (社群資料大數據對大選預測後的經驗)

在這次大選, 很多人包含林克傳說, 都嘗試著用聲量, 覆蓋率, 語意等等來去預測這次的市長選舉, 而彼得塔之鏡在 318 學運時開發了一套系統, 來計算網路社群, 每一個人對事情的支持度, 尤其是在沒有主動表態下也能預測與計算, 而在歷經幾次改版之後, 也獲得不少成果, 就最近回饋的狀況, 是有蠻高的準確率 (這以後會嘗試有個數字).

這次大選事實上也有算出資料, 但算出來是連我都覺得很奇怪, 因為我算出來的結果是:

1. 林佳龍與鄭文燦是有可能選上.
2. 以非國民黨候選人而言, 這六個人最危險的是游錫堃, 但也不是沒機會

我想一任何一個人應該在選前也不相信這數字吧, 我就在這邊做出列表:

從這邊來看, 應該發現馮光遠還是被棄保了, 但這兩個網路支持度與得票率一看就知道是有差距的, 但若有人有心去做個迴歸, 就可以看到這是相關係數 0.901 超過 90% 的相依性, 也就是說, 無法直接從網路支持度算出得票率, 但要從網路支持度的比例與次序, 算出得票率的比例與次序是相當準確的.

只是這有用嗎? 因為這公式即使真的知道, 也要確定出到底那一個是當選的最低標準, 例如這次是 網路支持度超過 55% 以上才能當選, 不到 55% 就會落選, 這數值是會因為下面幾個未知數來改變:
  1. 網路使用者人數 N (800萬~900萬)
  2. 選舉人口 M (1700萬~1800萬)
  3. 網路使用者在這投票區的偏離值 b% (5~10%)
  4. 投票率 v% (60~70%)
  5. 非網路使用者支持度 p% (???)
這邊網路使用人數, 指的是經常性透過社群網路接受資訊的人, 也就是至少要每天上一次臉書的使用者, 雖然說 N, M, b, v 都可以就經驗或有相關數字, 但比較麻煩的是 p 是最難掌握的, 也就是說上面的非網路支持度越接近網路支持度, 很多投票在選前就可以很容易精算, 只是我們知道這是不可能的.

但我們知道, 網路與非網路使用者的投票行為, 從想法, 行為模式, 接受資訊的方法, 思維邏輯的, 並非獨立變數, 也就是不能不考慮上網與非上網人的差異, 這是從 330 vs 54 遊行就可以知道, 只是這之間的差距如何, 就是從網路上完全抓不到的.

而我們若是從上網比例 35% 到 55% 的變化度, 依這網路支持度來去算這個非網路的支持度 p%, 此時會發現一個非常有趣的事實:


這數字是依這城市的上網比例多少, 來算出非上網者的支持率應該為何, 除了台北市外, 都可以直接算兩個候選人, 但網路上表態支持馮光遠的人太多, 雖然棄保是非常肯定存在的, 所以也只能嘗試著算兩種推論.

紅色字是我個人認為較接近的上網人口比例, 從這數字來看會發現一些很有趣的數字:

1. 連勝文, 吳志揚的非網路人口支持率是 63%~64%
2. 胡志強與朱立倫的非網路人口支持率是 53%~55%
3. 黃秀霜與楊秋興的勝敗跟網路無關, 怎樣都是輸的.

從這數字來看, 柯文哲與鄭文燦受到網路的影響較大, 甚至說是靠網路或網路的大勢來幫助是合理的, 而林佳龍勝選是靠自己, 台南跟高雄已經是未戰已分勝負了.

雖然這上面的推論或結論, 很多對選戰有經驗的人是早就知道, 只是不一樣的是從這數字來證明也是相當有趣.

只是這系統能不能在兩年後使用, 最大的問題是即使是社會的投票率與總人數 v, M 不變, 但上網人口比例與偏離值 N, b 一直會變, 而我們嘗試著用 p 代表著不上網或偏藍選民的支持率, 這次的 p 不只是代表網路族群與非網路族群的差異, 也就是說若沒有靠網路世代的掘起, 雙北跟桃園台中, 還是國民黨的天下.

只是這世代不可能改變, 民進黨只是趁勢而為, 所以有人說民進黨也不知道為甚麼會贏, 只知道靠柯文哲旋風, 而柯文哲的世代代表著網路世代的開始, 國民黨接下來要怎接招, 還是維持著不見, 不聽, 不聞, 不問的狀況, 未來的預測會更簡單了, 這系統會更容易接近結果了.

2014年11月29日 星期六

柯文哲用影分身打敗了連勝文一家人

撰文/食夢黑貘, 闇月鏡
 
選前很多人問我有沒有可能從網路上的數據推算出選舉的結果我都說每天上臉書的網民約 700~800 萬人,單就數據資料推算出來的意見傾向顯示約有 85% 的人支持柯文哲,不過這些網友在台北總投票人口200 多萬裡,只占 40%

若網路族群跟非網路族群的想法一致的話我認為柯文哲會大贏,變數在不習慣透過社群社交網路來獲得資訊的 60% 選民,他們的想法是否跟這 40% 網民一致

開票結果顯示出柯文哲最後只拿到 6 成的選票,這樣就可以計算出非網路族群造成的差距有 15% 以上,從這角度來看, 網路真的己經是選戰的關鍵了嗎? 我們來檢視看看

這次選舉雖說柯文哲贏在網路沒錯,這結果是因為柯文哲的網軍比較強大嗎? 或者是連勝文網路操作的太爛? 有時事實沒有那麼單純及直覺:

0. 柯不少政策直接由網民產生的網路部門却無法對政策有任何意見
1. 柯文哲的網軍是自發性的自媒體, 連勝文的網軍是用買的(末期還被切掉)
2. 柯文哲的開放式海選讓選擇及表現決定權在網民本身, 連勝文則是單向的發出訊息
3. 柯文哲嘗試轉化網路使用者的支持連勝文却用指責及切割讓支持者分裂

這次選戰有時候最大的錯亂就是, 到底有幾個柯文哲在選有太多的聲音不停冒出在支持柯文哲反對連勝文這些人不只參與宣傳,還製作漫畫文宣 網站,同時不停的主動分享對柯文哲有利的新聞 產出不利連勝文的文章及留言, 這些人積極的透過網路宣傳這想法, 其數量及積極度已經是接近 "霸凌" 另一邊陣營的人

你會發現, 柯文哲陣營最可怕的是柯文哲不只有一個競選團隊,而分身成上萬個網軍在背後支持」。
 
相較之下連勝文一直做不到接納及承擔,總是在切割, 凡是對自己不利的一律切割處理,不只切割自己支持者做的事也切割廣告公司外包商的作品甚至競選團隊顧問團都切掉了,已經到無所不切的地步

選戰後期決定連網路也切割掉了競選廣告不放網路上切割掉請來的網軍,結果就是連勝文的聲音越來越小, 最後網路上敢表態的支持者也變 0 了, 幾乎不存在了, 因此連勝文認為網路在罷凌,真的不是假像而是網路風向到選戰末期聲量的差異之大,真的是在「罷凌連勝文」。

網路一向有著非常靈活的訊息交換及傳播方式,當訊息是開放、開源、透明能被當成素材來運用的時候,就成為創作及內容的來源,柯文哲團隊採用開放的態度,釋出相當多素材讓網友使用,把網友當朋友看,而不是把網友當敵人來反或操作,一來一往之下差距就越明顯

連軍的問題就是不透明、不開放、意見管道太狹窄,以至於所有的策略都太一廂情願,被限制在自己的世界中,缺乏真誠的互動導致完全無法理解現在的網路世界及這個世代背後代表的選民,尤其台北又是全台灣上網人口比率最高的地方,說是柯文哲用影分身罷凌連勝文,也是結果論了。
 
柯文哲網軍圖取自於 http://kwj.board.tw/ppl.php

2014年11月28日 星期五

從官網的比較來看柯文哲與連勝文的使用者分析

這次的選戰跟以往不一樣的是網路味特別濃, 上一篇講到社群的反應, 事實上除了社群網站的使用者之外, 還可以從官網的使用狀況來做比較, 也是相當有趣的.

雖然 Alexa 的資料不多, 因為這兩個網站流量本來就無法跟一般網站去比較, 但從 SimilarWeb 中倒是可以看到不少端倪, 我們就來慢慢發現有趣的事吧.

1. 流量, 柯文哲官網以 60% 小勝:

網站的流量有時是沒甚麼好比的, 但這也是網站的重點, 就 Similar Web 說, 柯文哲是 490K, 連勝文是 310K, 也就是柯文哲官網占這兩個網站的 60% 強, 事實上就最下面的導流來看, 柯文哲在網路上最有趣的是靠 "網站群", 例如 "柯P新政" 等, 所以理論上應該還會更多才對.


2. 使用者行為, 柯文哲官網的停留時間, 瀏灠頁數與跳出率都較好:

事實上比流量某些觀點是較無趣的, 較有趣的應該是看網站的幾個價值就是 "停留時間, 瀏灠頁數與跳出率", 很明鮮的是柯文哲官網在這邊有很大的差異, 也就是停留時間 3:01 比 1:55, 每次瀏灠頁數是 3.16 vs 2.95, 而跳出率 (只看一頁就走人) 是 51% vs 61%.

這代表的是柯文哲官網的內容, UI/UX 比較受其使用者接受, 雖然這邊有兩個原因, 在很多地方這兩個官網的架構雖然差不多, 但內容本身是有差異, 族群是有差異, 最後造成這現像說不定只能證明這兩個族群的差距, 也就是會看連勝文官網的人對網路的依賴度較低, 說不定這才是重點之一.


3. 來源的比較, 連勝文官網在直接流量與導流都較高:

雖然這樣說似乎理論上連勝文官網在搜尋與社群導流較弱才對, 但事實上差距不大, 因為這數字有幾個代表意義:
會來看連勝文官網的人來源不是透過網路, 所以造成直接流量很高, 也就是說靠文宣等非網路來的人是偏多的
上面這句話似乎更能證明連勝文官網的族群不是網路使用者, 至少不是網路重度使用者.

4. 搜尋字詞, 搜尋到連勝文官網的關鍵字, 實體連結的較多:

大家都會搜尋政見, 行程與活動, 這也是自然的, 當然柯文哲推出一系列的活動, 商品都有很不錯的效果, 自然在 Search Term 就很明鮮, 這是跟連勝文官網不一樣的地方, 相較之下由於一些 "選戰疑雲" 的關係, 這些字在柯文哲官網也是很明鮮.


但連勝文的使用者會搜尋地址與電話, 這在柯文哲官網是較看不到的, 這代表連勝文的支持者透過網路最後還是要用電話, 地址來做實體接觸, 這也是更可以發現族群差異的地方.

5. 新使用者比例, 柯文哲官網不少回流:

網站有趣的除了覆蓋率能夠讓更多人知道外, 另一個是使用者是否能夠回流, 柯文哲官網有 4 成的回訪客, 相對的連勝文官網只有 2 成, 這也可能跟網路使用者習性有關.

6. 導流網站, 連勝文官網多是新聞網站, 柯文哲多是討論區:

從這邊兩張表來看, 左邊是柯文哲, 右邊是連勝文:


可以看得出來右邊很多是新聞網站, 例如 UDN, 中時不可能出現在偏向柯文哲的媒體, 在這邊變成連勝文的主力, 而關鍵評論是兩邊都有, 但應該說連勝文導流的 10 大來源有 6 個是新聞媒體, 而柯文折只有 2 個, 這才是最大差異.

btw, 在 UDN 的討論居然在柯文哲官網站不少, 這也相當有趣.

7. 曝光式廣告, 很不幸的, 只有連勝文有:

柯文哲官網從 Similar Web 來看, 是出現一隻小狗: "NO DISPLAY ADVERTISING", 也就是說算不到有買曝光式廣告, 相對的連勝文是:
但我們知道連勝文官網買的廣告還包含酷比等系統, 而其他非聯播網廣告的是無法從這邊看得出來的.

從上面幾點大概可以看到這兩個官網本身並沒有勝敗優劣, 唯一差別的對像與經營方向的不同, 一個對像多是網路族群, 多是社群自發性, 另一個則是不少非網路族群, 多是靠廣告與媒體趨動, 這是原因還是結果, 就讓大家自己去想吧.

SimilarWeb 網址:
http://www.similarweb.com/website/kptaipei.tw?competitors=taipeihope.tw
http://www.similarweb.com/website/taipeihope.tw?competitors=kptaipei.tw

勝文被霸凌了嗎? 來看媒體光譜圖與變化

最近連勝文一直說他處於一個被霸凌的狀態, 事實上如何我們來看看...

這份資料是從林克傳說的工人智慧加人工智慧系統所算出來的, 系統是透過臉書使用者的分享, 計算其覆蓋率, 然後透過人工判讀此連結的傾向所算出來的結果.

請大家記住, 這數字是有其特殊性的, 是一個持續性計算與搜集資料的系統, 跟所謂的市調與民調是不一樣的, 所以只能代表那段時間, 網路上討論與關心的方向:

1. 必須要有媒體寫出文章
2. 透過使用者的分享覆蓋率超過 2%
3. 一個議題可能有同時存在六種意見
4. 代表言論的覆蓋率而非投票的傾向

雖然這是分析媒體的效應, 而不是候選人, 但從這邊可以整理出很多很有趣的數字, 我們一項項來看:

I. 總聲量

在這些時間來, 反對連勝文之類的言論被散播 286737%, 也就是說平均一個人會聽到 接近 3000 次在網路上講柯文哲好話, 相對的反對柯文哲之類的數字是 80909%, 此時我們定義一個值叫 P 值, 也就是這兩種言論的相對率, 這邊後面都會用到, 而在網路上的整個 P 值是 78.0, 也就所有的言論對柯文哲有利是 78%, 相較連勝文只有 22% 而已.

II. 媒體 P 值的傾向

這邊要分成兩部份來講, 一個是大眾媒體, 一個是非大眾媒體, 就非大眾媒體而言, 除了柯P自己的柯P新政外, 大概影響力都不太夠, 但可以肯定的柯P官網的 P 值當然是 100 分, 是無庸置疑的, 而剩下的四個就是社群媒體, P 值最高的是 WeTalk, P 值為 97 分, 且總影響力也最高, PTT 第二名, P 值為 93 分, 事實上 disp.cc 的 P 值也是 93 分都差不多, 其中 P 值最低的是 Youtube, 剛好是過 75 分.

而大眾媒體又完全不一樣, P 值最高的是關鍵評論網, 剛好過 75 分, 但幾個影響力較大的媒體如蘋果日報 (68分), 自由時報 (70分), 新頭殼 (69分), 風傳媒 (55分), ETToday (55分), 可以看得出來大家的分佈都差不多, 甚至是分成 7 成與 5成5 的兩個族群, 真的相當有趣, 偏離度最大的是 UDN, P 值只有 46 分, 可以說是在臉書使用者散播中 P 值最低的, 也就是跟其他的媒體的立場與讀者比較起來, 說不定是最 "特殊" 的.

所以從這邊可以得出一個結論: 媒體雖然是對柯文哲有利的新聞較受歡迎, 但並不會超過 75%, 但社群媒體是沒有低於 75%, 也就是較為一面倒.

這數字不是代表這媒體的言論比例, 而是經過覆蓋率轉化的,  跟則數無關.

III. 這 200 天的趨勢圖

隨著選戰的接近, 幾乎是所有的最高點都是發生在最近, 下面是單日覆蓋率最高的那一天與比率:

11-18 反對柯文哲言論覆蓋率 53%
11-24 支持柯文哲言論覆蓋率 79%
11-27 支持連勝文言論覆蓋率 57%
11-27 反對連勝文言論覆蓋率 84%

所以這選戰還真的是在最後面越受大家討論.

IV. 媒體的轉變

有些人很關心在這段期間, 各個媒體的偏向 KP 的比例有沒有變化, 事實上從下表看到幾個有趣的事:

1. 幾個有較大影響力的媒體在 11 月是新低: 如蘋果, 自由, 尤其是 ETToday 居然創下 20 分的新低, 對連勝文有利的言論此時在新聞傳媒被大量散播.
2. 但總聲量較低的媒體, 幾乎只剩下偏向柯 P 的新聞被散播: 如 UDN, nownews, 但數量都不多.
3. UGC(使用者產生)的網站, 除了 Youtube 外, P 值都是 100 分, 這代表在社群已經完全沒有人支持連勝文嗎?

所以就上面的四點來看, 你認為勝文被媒體霸凌了嗎? 只能說, 網路中的社群媒體是沒錯, 但大眾媒體倒是不會的, 甚至要說這個月, 有股力量在操作大眾媒體, 這句話也不完全是補風捉影喔....

2014年11月26日 星期三

深入了解 Google 放棄 Page 的真正原因

這幾天的 SEO 界, 最大也最沒有意義的是, Google 已經宣稱不再更新 Page Rank, 雖然說這不是新聞, 而是去年 12 月時, 谷歌已經委婉的說, 請大家不要看 Page Rank, 甚至在 Tool Bar 等直接閹割掉了, 但這次還是官方直接指出 "沒有計劃更新 Page Rank"...

記得在幾年前, Google 最有名的就是 Google Dance (跳舞) 這儀式, 指的就是在 Page Rank 更新時排名大伏度的上上下下, 而現在這儀式已經不再有時, 而當時架構出 Google 的基礎, Page Rank 就如此的被割捨了, 這原因是甚麼呢? 這邊做幾個深入分析:

1. PageRank 值是往往被黑帽 SEO 玩弄的指標, 甚至是某些問題點, 此時 Google 把這點直接給丟掉, 可以說是讓很多黑帽 SEO 少了可以操弄客戶的可能性與機制, 讓大家回歸到網站與使用者的經營, 這才是最重要的.

2. PageRank 的精度越來越低, 也是因為前面的狀況, PageRank 變得很難去較準確的算出網路的狀況, 變成最後只能靠其他方法與技術去修正, 導至最後其他的演算法比 PageRank 更有價值的因素.

3. PageRank 是個很難維護的演算法, 因為這不只是個會回饋, 會遞迴的演算法, 我一直認為這演算法不是甚麼, 但能夠設計出一套真的算出來的系統才是 Google 當時的基礎, 只是這個隨著網路的發展, 計算 PageRank 成本已經越來越高, 使得更新週期越來越長, 此時放棄這種高維護成本且低精度的事, 也沒甚麼好意外的了.

4. PageRank 已經只是超過 200 種因素的其中之一, 且意義越來越小: Google 透過 Chrome, Android, Analytics 等機制, 已經可以有更多, 更直接, 更準確可以算出網站價值的方法, PageRank 在 SERP 的意義已經是九牛一毛了.

5. 反正 PageRank 已經壞掉很久, 且沒人可以維護或有影響, 甚至 Google 沒人有興趣修護, 畢竟若是有人做出新的專案, 對公司是個 Credit 貢獻, 但去維護舊的架構, 即使做了也不會有人把你當成對公司有貢獻, 所以也是種政治下的因素, 就這樣沒了, 這似乎在商場也是很常見的...

因此這時候放棄被操弄, 精確度存疑, 成本高的 PageRank, 不只是時候, 而是應該更早才對, 但或許 Google 真的要去把 Page 切割掉, 在歷史上, 在政治上, 都是很難去做決定的, 而最後壓垮駱駝的, 就是成本太不划算了, 畢竟商場是沒必要把資源花在一個用不太上的東西, 即使再有情感, 尤其是 Google 已經是跟著 Microsoft, Yahoo 等公司練就一樣的次元刀切割技術, 越切越快, 越切越多, 此時切掉 PageRank, 也沒甚麼好意外.

SEO Ranking Factor, 影響 SEO 排名因子初探 (2014), CTR 變成最重點 這篇文章說, 我有提到 Search Engine 的四個時期:

1. 架構時期: 內容, 引用, 標籤, 關鍵字...
2. 點擊時期: SERP, RSS, GA, Chrome, ...
3. 社群時期: +1, SNS, Meta Data, Semantic Web, ...
4. 個人時期: Authority, Device, User, Relationship, ....

在某方面, 架構時期已經快到一個極限了, 此時把以 "引用" 為概念的 PageRank 放掉, 也代表其他三個因素也越來越重要了, 尤其是那邊說到的 CTR (Click Through Rate), 就是一個很重要的使用者信號, 且這信號是來自於對內容,  UI/UX 各種因素的綜合因素所建構出來的, 因此此時把重心重回到個人, 使用者, 與社群是相當對的.

所以, 讓我們開始見證沒有 Larry Page 的 Google 時代吧, .... 阿, 只是沒有 Page Rank 而已啦....

ps: 圖取自 https://www.seroundtable.com/google-pagerank-dead-again-19482.html

2014年11月22日 星期六

從令人震驚的 Techcrunch 的改版來看 Tag 在 SEO 價值


這故事大概是在兩三個星期前, 因為在跟某人(團體)講一些 SEO 的事, 提到我每次都十分強調的 Tag (標籤), 說不定很多人都聽到耳朵長繭了, 而我在那次就隨手拿 Techcrunch 來做介紹, 但一時從文前到文後都找不到, 我在想 Techcrunch 一定是瘋了, 怎會把 Tag 拿掉呢?

但仔細一看我震驚了, 原來 Tag 不是被拿掉, 而是被放在比 "Popular Post (熱門文章)", 的左邊側欄最上面的地方, 也就是所謂網頁的 "Hot Zone (熱區)", 且更是緊臨著文章標題 (Title) 的地方, 也就是大部份人眼球落點最開始的地方.



這件事代表著甚麼呢?

資訊要能夠有用, 代表許多問題的解法都是可以參考之前的作法, 若是每次問題都 "不一樣", 那資訊的價值就很低了, 而這 "一樣" 指的就是資訊的 "聚焦".

只有很少數的人上過我 SEO 的課, 就知道我開宗明義就是講 "聚焦", 而這聚焦在搜尋引擎最佳化的精神就是落在 "關鍵字", 而這關鍵字不是單純以 "分類" 的觀點, 但應該說, 現在的分類已經很難追求:

1. 獨立互斥
2. 階層式
3. 客觀

因此原本關鍵字 (Keyword) 的搜尋行為觀點, 慢慢的從 "分類 (Catalog)" 變成 "Tag (標籤)", 這標籤變成資訊 "聚焦" 的主要方式.

但會是把標籤 (Tag) 變成 SEO 重要的精神不是如此, 而是:

1. 時間: 最早寫出這概念的文章往往是最權威的, 所以 SERP 應該放在最前面, 但相對的最新的文章代表更有即時性價值, 因此也該放在 SERP 前面, 但一篇文章不太可能同時是最早 (舊), 卻又是最新 (剛更新), 而相對的標籤頁 (Tag Page) 卻是有這種特性的網頁, 很早就產生, 但持續因為有新文章有此標籤在更新.

2. 內容的聚焦: 要一篇文章一直重覆講相同的東西是沒有意義的, 刻意去做就會讓讀者相當辛苦, 就變成是黑帽 SEO, 但相對的標籤頁卻是必須這樣做的, 因為這些文章列表本來就是因為這個相同的概念所集中在一起, 重覆出現是相當合理的.

3. 連結: 我們知道連結在 SEO 是相當重要的, 但也不太可能讓一篇文章一直被連結到, 即使是靠相關文章所能創造的連結就是那幾個或是相當有限的, 但 Tag Page 擁有的連結不是一般文章能夠比擬的, 幾乎是每個 Tag 都會有連結到這頁, 所以即使在外部連結如此難賺的情型下, 內部連結至少是要有好的結構.

4. CTR: 有了內容的聚焦, Click Through Rate (CTR) 自然就會起來, 而 CTR 起來代表點擊數與曝光數夠高, 使用者使用的機會高, 若再能推 Share (Social Signal) 一把, 標籤頁幾乎是一般內容頁不能夠比較的.

事實上已經有人發現了, 若是網站架構正常, 一篇新的文章的確可以很快的在搜尋結果頁 (SERP) 在前幾名, 但沒多久就被洗到後面了, 而最後留下的幾乎是 Tag 頁面, 因為這標籤頁就是擁有上面幾項特質在 SEO 佔盡便宜.

但我都可以開玩笑的自稱 Tag 傳教士, 但我還真的不敢做出像 Techcrunch 一樣的事, 既然 Tag 有這樣的 "高價值", Tag 可以做為對使用者的閱讀導引, 甚至做為搜尋與分類的導引, 這麼重要的事為甚麼要拘泥於我們習慣放在文章的最後面呢?

這次 Techcrunch 做出這樣的事, 我是認為相當合理的事, 因為通常左上角的 Hot Zone, 往往是放 "麵包屑" 或是 "分類導引" 的地方,  而 Tag 本來就具有這兩種屬性的事, 而在麵包屑與分類往往不夠聚焦, 也就是太過廣泛, 相對於 Tag 是對文章的關聯有相當大的地方, 為甚麼那邊不放 Tag List?

Techcrunch 除此之外一些細節也做得很不錯, 進到 Tag 的頁面, 不只是跟大家樣樣就顯示有這 Tag 的文章, 也列出這篇文章有那些其他的 Tag 做為下一步 Refinement 得導引, 雖然做這件事的人相當多, 也沒甚麼好意外的, 但最有趣的是下面.

TC 也對這個 Tag 做了簡單的介紹, 甚至是以自身角度做出發, 例如是 Gadgets 就會加段描述: "The hardware that’s bringing computing everywhere", 用很輕鬆的角度來定義 Gadgets, 而 Asia 就會以自身角度出發的寫: "The latest innovative tech coming out of Asia", 不是寫亞洲的定義, 而是以 TC 地角度來寫, 最後把這段字放進 Titile (標題), 此時 SERP 就很漂亮了.

除此之外, 也把分類與 Tag 打破, 已經不存在分類, 也就是 Tag 在某些地位上已經跟分類差不多了, 說真的要我也因此放棄分類我也做不到, 雖然這是合理的, 但也是有些可以討論的.

當然還是有做不夠好的地方, 例如在 meta-data 的 description 並沒有放進去的許多小暇疵, 但暇不掩瑜, 這次讓我震驚的地方著實讓我自省很多, 因為就理論面與技術面, 這完全是對的事, 但我們往往因為不想改變或積非成是(?)的習慣, 讓我們沒有進步與做好, 這才是重點, 而不是只有 Tag 這件事.

2014年11月14日 星期五

我潛意識中心裏真正支持的台北市長

"人類的政治會那麼紛亂, 不是有太多人參與政治或是參與政治過深, 反而是因為大多數的人對政治漠不關心甚至厭惡紛亂的政治, 尤其是那些掌權的人更不希望有更多的人來參與政治, 這樣他們才可以用政治之名為所欲為, 政治才因此這樣紛亂~~~"

雖然說民主政治的架構是在於 "選舉", 但不代表人須要參與 "眾人之事" 只須要 "投票" 而已, 而是要去更多的參與社會與政治, 其中投票更是須要更認真與關心而已, 這次選舉大家要更認真的面對, 因為每次選舉影響是四年, 尤其這次是僅次總統大學的大規模的投票.

其中最重要的就是 "台北市市長" 的選舉, 是這次九合一大選最被重視的, 因此就更延伸的以 "彼得塔之鏡" 為出發, 做了這個 "我潛意識中心裏真正支持的台北市長", 事實上也不只做台北市, 包含新北, 桃園, 台中, 台南, 高雄的六都都有計算.

這系統是架構在下面兩個基本假設:
1. 要了解一個人先了解他的朋友
2. 很少人會表達自己的想法, 但可以從他的 "看法(閱讀資訊的方法)" 得知.
也就是這系統是算你與你的好友中, 有參加 "足以宣傳" 某候選人的粉絲團的數目, 因為只要這個粉絲團是經過判斷出來是跟這候選人相關, 就可以知道這個人透過朋友獲得這資訊的多寡與密度, 然後經過幾次正規化:

0. 你與你好友有多少人加入這幾個粉絲團
1. 正規化一個人有多少好友得知一個數字 (分數)
2. 這個頃向占全體使用者的比例 (比例)
3. 將前兩個數字相乘 (正規化)
4. 這數字跟其他數字的比率就是 (機率)

而這最大機率的選項就是你的傾向, 而這機率就是這預測的準確度, 所以有人的準確度說不定不到 50%, 但也有人超過 90%, 最後還幫你的頭像套你 "該表態" 的立場.

但這圖用的機器與授權是在 "我的想法我做主" 上面, 所以必須要在那邊有登入才能抓到.

這次系統是由闇月鏡所設計, 包含組圖也是,  最後有興趣大家可以去 http://ele.que.tw/ 做做看...

2014年11月10日 星期一

四種工具讓你對台北市長選舉做出更好的選擇

這次九合一選舉已經不到 20 天了, 這次選舉跟以往不一樣的地方, 就是網路成份比起以往特別的濃厚, 雖然在四年前蘇貞昌的選戰可以說是網路選舉的初體驗, 但成熟度以現在的觀點還是不足的, 而現在的今天, 網路對一半以上的選民是不可或缺的管道.

其中最大的原因主要有兩點:

1. 已經沒有甚麼傳統主流媒體, 不在網路上看不到了
2. 社群媒體變成導讀的最大工具

但從 318 之後, 媒體人對網路工具的應用有更深刻的體認, 甚至有越來越多人投入這行列也是很重要的原因.

只是網路不該只是媒體而已, 網路是一種更可以有互動, 個人化,  實用的系統, 分析的工具才對, 這次的選戰也已經開始有這樣的味道了.

這次選舉已經有不少粉絲團, 部落格, 網站出現來參與這次的 "盛會", 這邊列出不同的四種工具 (網站) 讓你在這次台北市長選舉時, 做為決策的輔助系統:


這個是利用一些問答, 定義出你的想法跟那個候選人的政見較合, 這系統最大的特色就是找出候選人議題的分歧點, 透過你的選擇來做對應. 

這系統用九個項目的九宮格來呈現, 在之前還讓你選出可以加權與加重的選項, 這系統無論就 UI/UX 都是很不錯的設計, 當然唯一的問題是問題太少, 所以產出來的結果解空間只有 2^18 個, 但做為最後只有三個選項的決策支援已經很夠了.




市長給問嗎是一個由沃草做的系統, 可以說是用問答的方式由選民對候選人提出問題, 然後我們可以看到他們的回答後, 來做為決策的參考.

除了問答的內容外, 能夠參考的就是回覆率, 回覆率越高或許可以當作對選民是否較為正面的態度, 雖然說這系統的踴躍度不夠, 不然會更有意義.




這是一個以臉書朋友為基礎的表態系統, 透過表態的選擇可以讓你知道你的朋友與全部人的想法為何, 然後可以知道這之間的差距.

這系統重點在於你跟你朋友的互動, 讓你知道你的族群是甚麼, 或者是你有那些朋友可以討論或辯論, 可以用這系統做為去改變自己或改變別人的線索工具.




人會很習慣的去選擇跟自己想法類似意見的訊息, 或是去排除掉不同想法的來源, 透過這樣的機制, 若是你的朋友大多人有參與一個特定方向的粉絲團, 代表你就是有這屬性.

利用自己與朋友參加的粉絲團數目, 跟大家做比較, 就可以知道你的傾向是甚麼, 若這粉絲團是候選人的粉絲團, 就可以判斷出你閱讀資訊的取向, 有時就接近你所支持的候選人.


除此之外, UDN 也做了一個互動性相當高的選舉專題, 透過資訊圖表讓你用較為主動, 較為平衡的方式來看這選舉與候選人, 其中包含 "話題", "熱度", "行程", "民調" 等等的資訊, 也是另一種做為決策參可的系統.


但話說到現在, 還剩多少人還沒決定呢? 這才是比較有趣的問題吧... 但若能夠過這樣的系統,讓大家改變想法做出 "更正確的抉擇", 也是好事阿.

2014年10月30日 星期四

成為資料工程師所須要學習的 28 堂課

雖然說 Big Data (大數據) 是一個很夯的話題, 但就像一個笑話:
Big Data is like teenage sex:Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it so everyone else claims they are doing it too.
雖然說就大部份而言, 這笑話是真的, 只是誇張了點, 因為 Big Data 目前遇到的問題還是相當的多, 就像是前幾天有一個朋友問我, 為甚麼電子商務網站都宣稱想做或要做資料探勘或大數據, 但為甚麼沒人去做呢? 我回答了幾個問題點:

  1. 沒有真正了解資料價值的專案負責人: 大部份的專案負責人或產品經理, 都是從業務, 商品, 行銷出身, 對他們而言無論是在學校的學習, 執行的經驗, 進修的內容都沒有相關的知識, 在沒有對這種背景知識有足夠了解的人, 如何去產生與企劃, 既使大部份都是別人在做的, 但若沒有概念是不行的.
  2. 要有人對做出來的業績與成果去承擔: 而若是沒有行銷與業務或產品去推, 那由資訊的人去推或許是合理的, 但最大的問題是資訊在電子商務是屬於後勤人員, 本身是不扛業績的, 而這種專案做出來會排擠其他的 Quota, 在沒有人須要的情型下最後只好無疾而終.
  3. 外包的成本太高, 但內部的人又沒經驗: 上面兩個問題若是遇到有心的老版就不是問題, 但真的要開始做時面臨到到底要 In-House 還是 Out-Sourcing, 雖然內部做是外部的三分之一到五分之一, 且對 BI (企業智慧) 比較能夠切中目標, 但人才與經驗是個很大的問題, 所以不是大好就是徒勞無功.
  4. 比 Big Data / Data Mining 更重要的事還很多: 大部份的電子商務公司最大的問題是資源不足, 而大家可以看 "九項如何建立有效商品推薦系統, 所須要知道的進程導引與架構指南" 這邊就可以知道能做的還很多, 在人力與資源不足得情形下被放棄或延後是合理的.
當然大家知道最大的問題還是台灣的市場與老版的企圖心都不太夠, 但拉回來, 身為工程師的我們, 真的有足夠的能力去擔當這責任嗎?

台灣的價值應該是在於人才, 而要去實作出這樣的系統須要:
  • 資料工程師: Data Engineer
  • 資料科學家: Data Scientist, Data Mathematician 
  • 資料專家/經理人: Data Expert, Data Manager
有人把這三個角色畫成下面的圖我覺得蠻有實務感的:
這邊大概畫出這三個角色的可能關係, 但在實務界更多的是一個人當三個人用, 也就是你甚麼都要會, 最後大概變成一個人要會的東西是成為下面這樣:
雖然說大部份的人能夠做好一項就很了不起了, 但真的最好須要這三項領域的專才的人, 通常不是一個人做到, 而是至少三五個人去架構與協調出來, 只是在台灣是不用太期待.

而在這次鐵人賽的緣故, 我大概規劃了一個 "成為資料工程師最初的 28 堂課", 因為有太多人對成 Big Data / Data Mining 有興趣, 而不知道如何下手, 花了 30 天 (包含導言與結論) 列出了 28 堂課給大家參考, 雖然說是 28 堂課還不如說是 28 個科目, 只是最後發現 28 真的太少了, 所以有些科目還合併在一起.

這 28 堂課除了最後一堂外, 也是把課程分程三部份:
  • 電腦相關 (Hacker)
  • 數學與統計相關 (Mathematician)
  • 社會人文相關 (Domain Expert)
每一類別有 9 科, 下面就是列表:

電腦相關


把這些知識打下基礎, 真的有實作的能力, 才是這社會最缺的, 也才是這社會推進的原動力來源, 每一個人都想個當管理者, 每一個人都想當個出嘴不動手的專家, 最後沒有人動手, 只是真正的價值應該是實作出成果為前提阿, 雖然之後的管理, 行銷是讓價值更高, 可以把成果的價值乘上好幾倍, 但若沒有這基礎做出東西的話, 永遠不會有第一個 1 出現, 因為若沒有了 1,  0 乘上 100 還是 0 阿.

所以我們就應該先當那個 1 (The One) 吧.

* 圖一來源: http://www.slideshare.net/ckliu/z-b-38495724
* 圖二來源: http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

2014年10月25日 星期六

如何找到你網站/部落格最可以賺 CPA 的網頁

雖然說 CPM (曝光式廣告) 還是有存在的價值, 但已經慢慢失去其角色, 而在這系統完成的同一天, BlogAD 也宣告停止營運, 雖然不是說部落格廣告已經沒落, 但至少肯定的是部落格部份的 CPM 廣告已經快沒市場了, 其中有幾個很重要因素.
  • 部落格的流量本來通常就不大
  • 部落格的價值在於影響力, 只是看流量跟本是踐踏部落格的價值
  • 許多廣告系統透過 Re-marketing, RTB 等等技術提升 CTR, 此時再只講 CPM 就失去意義
只是部落格不賺 CPM, 還能做甚麼嗎? 自然大家會想到的就是 CPC 與 CPA.

在 Adsense/Adword 的進步下, 可以從內容方向判斷出那些廣告是合適的, 因此 CPC 已經達到一種境界, 但網站最有價值的不應該只是如此, 應該是更有人性的 CPA 才對.

一個網站由於有不錯的文章, 帶來不少的流量與效應, 此時應該可以肯定 CPA > CPC > CPM 才對, 只是 CPA 不是那麼簡單的事, CPC/CPM 可以靠聯播網來達成, 但 CPA 真的要做的好, 還是要有人下去操作才對.

而昨天在跟某兩位朋友聊天聊到, 的確這是很好的出路, 但這邊有幾個問題存在:
  1. 如何找到自己網站最受到讀者注意的網頁
  2. 找到合適這內容的商品
  3. 如何串接起商業模式
我那位朋友慢慢的把第二點與第三點串起來, 這部份須要有足夠的 Sense 及執行力與經驗, 對我那朋友不是問題, 只是第一點是很麻煩的事, 此時我就想到網事 (web.mas.ter.tw) 可以用其架構解決其問題.

而網事是一個透過 GA 來去做網站 SEO 建議的平台工具, 而一個有價值的網頁, 至少是合乎一點:
有足夠的吸引力讓使用者進到這個網頁
此時就可以用 GA 的 API 來做計算, 從開站的開始每一週每一週計算出能夠讓使用者搜尋進來的落點頁的訪客數, 來定義那些網址有足夠的價值去尋找更高的 CPA.

這邊還須要討論的地方, 就是 SEOKPI 是以月為單位, 而網事是以天為單位, 通常以天為單位容易受到極端失準或看不出來, 但若是用月為計算單位又不夠即時, 所以這是我第一次用週為單位計算的系統.

這個系統目前是在網事的子系統, 自然要先設定才能執行網事, 不了解的可以看 "網事知多少, web.mas.ter.tw 啟動" 這篇, 然後按下 "有價搜尋" 之後, 第二天才能看到資料, 當然若是之前沒有使用過的, 就可能要等到第二天才能夠按下去, 但之後就是每週隨時可以來檢查上一週進度, 如下圖:


接下跑出來的就會像下圖:


從上圖來看, 大概就是若去年我應該直接去跟 PQI 談 CPA, 且當時好像他們有看了我文章做了些改善, 但是最須要的功能並沒有完成, 所以我本來想要寫篇文章褒揚最後作罷.

但大家應該透過這工具, 就可以很即時且自動化的幫你找到你的網站是那篇作品是最合適去賺 CPA, 只是這只有幫助大家第一點, 而接下來的兩點: 找到合適內容的商品及串接商業模式, 須要的話我可以幫你介紹, 這樣讓大家寫部落格或做網站能夠多一點收益, 而能夠持續有好的處作, 這才是我最希望看到的結果.

2014年9月26日 星期五

SEO Ranking Factor, 影響 SEO 排名因子初探 (2014), CTR 變成最重點

雖然我只是個工程師級的技術顧問, 但偶而還是會不小心跨到 Marketing, Management 與 SEO, 尤其是 SEO 我是會幫我顧問的公司做一些基本的教育與教學, 而上過的人就知道, 我這幾年最喜歡從 SEO 的 Ranking Factor 講起, 因為這是最實際有意義的 Guide, .....

知道 SEO Ranking Factor (SEO 排名因子) 最大的好處, 就是透過檢視這些經過 "量化的因子", 就可以知道 SEO 書的價值與不足, 尤其我一直叫大家一定要想辦法挪出時間看第一本 SEO 的書再來看網站, 且我往往會建議大家讀美國或日本的翻譯書, 若是直接看原文是更好, 而不希望大家看中國與台灣人寫的書, 這不是說台灣人的書寫的不好, 而是台灣的出版市場很欠缺一個 "Peer Review" 的動作, 且一個足以寫出相同等級書的人去作評論修正, 我們知道人非聖賢難免有錯, 若是有兩個人以上檢視同一個主題, 往往可以彌補一個人思維的錯誤, 這點相較日本與美國就做得好多了, 就我的經驗錯誤會少很多.

當看到今年 searchmetics 出的 2014 年報告, 趕緊唸完, 而在還沒唸完時, 看到新的圖表, 不禁覺得真被我說中了, 在 2012 年 iSearch 時, 我的題目是叫 "SEO 大未來", 我把搜尋引擎的因子分成四個種類與階段:

1. 架構時期: 內容, 引用, 標籤, 關鍵字...
2. 點擊時期: SERP, RSS, GA, Chrome, ...
3. 社群時期: +1, SNS, Meta Data, Semantic Web, ...
4. 個人時期: Authority, Device, User, Relationship, ....

當時說, 搜尋引擎要做得好, 必須能夠讀懂內容, 知道使用者怎樣用, 以及知道使用者要問甚麼, 其中一個很重要的 "知道使用者怎樣用" 的必要因子是拿到大部份網站的瀏覽資料, 而 Google 原本只能透過 SERP 的點擊知道使用者怎點入網站, 透過下面幾項:

0. Google Tool Bar
1. Adword/Adsense
2. Google Analytics
3. Chrome
4. Android

其中說到當 GA (Google Analytics) 與 Chrome 等瀏灠器達到一定的比例時, 遲早會加入使用者點擊做為搜尋排名的參考.

在上個月, Facebook 也提出這樣的演算法, 當使用者即使看到連結, 若不會點擊, 或點擊後立刻回來 (離開), 就代表這連結是沒有價值的, 也就是透過使用者的行為我們可以更精確的對資訊做價值判斷, 來協助更多的使用者, 在這次的報告中, 也就提出了 "User and Traffic Signals" 這概念, 其中最主要的三個項目是:

1. Click Through Rate
2. Time on Site
3. Bounce Rate

在上個月因為某個場合, 我寫出一段 "SEO 精義":

"用有意義的內容, 連到有關聯的網頁, 讓對的人去點擊與分享"

其中用的就是 SEO Ranking Factor 中的:

1. 社群: 分享與按讚
2. 連結: 外連與內連
3. 內容: 關鍵字
4. 技術: UI/UX, 結構

也就是:

用有意義的內容: 從好的文章與關鍵字下手
連到有關聯的網頁: 找到好方式把網頁給串起來
讓對的人去點擊: 要有好的 UI/UX 的環境, 去促成連結的點擊
分享: 社群是目前最重要的因子

而這次中 "讓對的人去點擊", 也就是 CTR 變成了第一名的重點, 這個是以前 Google 或任何搜尋引擎做不到的, 在 Google 運作下終於做到, 也就是說這個是每一個曾寫過搜尋引擎的人都想做的事, 但最後也只有可怕的 Google 做到了, 雖然有人認為這不是好事, 但若能更精確的搜尋到使用者要的答案, 也未嘗不是壞事.

而這邊在我眼中還有一個相當重要的重點, 就是連結的價值, 其中有幾項是大家沒注意到的:

1. 連結的品質
2. 連結的數量
3. 網站的價值
4. 網站 (Domains) 的數量
5. 新聞連結
6. 新的連結
7. Nofollow 的比例
8. 連結的時間
9. 首頁與Deep Link 的分布
10. 錨點文字的稀少性
11. 錨點文字數
12. 錨點文字是首頁網址的比例
13. 錨點文字是品牌字網域的比例

這些都是 Backlink 連結的價值, 也就是當連結的因子越複雜, 往往就越難操作, 這也就是黑帽越來越難做, 但認真的連結價值也變高的原因.

(此時就發現 weblog.tw 真的在這計劃, 在這次的 Backlink Building 更是相當有值, 因為當時就是以 CTR 做出發, 建立高品質高數量的連結)

而除外那些網頁的基本結構, 雖然還是搜尋排名的因子, 但相較 CTR, Social 與 Backlink 比重就差很多了.

2014年9月18日 星期四

我們來捕獲野生柯文哲, 民意儀表板開放 API 讓大家知道我們是怎看 柯P 的....

記得我跟某位候選人的某個競選單位的某一群人說話, 他們劈頭就問我, 支不支持某位候選人, 我就說:

"我連自己都不相信了, 怎會去支持一個人, 我只針對我認同的想法理念付出, 跟人無關".... 

看到 TonyQ 與 Even Wu 推動的柯文哲野生官網, 我覺得是個很不錯的想法, 但我一直認為, 我們若選擇一位候選人, 不只是要去聽他說甚麼, 而是更希望他能夠聽我們說甚麼, 在之前因為某機緣做了 "民意儀表版", 所以想說在工作坊當天發表 API 給大家用, 但後來因為臨時決定回台南過中秋節就做罷...

但這想法我覺得還是要推動, 只是這兩三星期忙到不行, 一直到今天才有時間把這計劃完成.

這個民意儀表版雖然是架構在林克傳說, 但還是有所不同:

林克傳說只算分享的外部連結, 民意儀表版只要是分享就可以.

所以在 http://kwj.board.tw/ 就可以看到現在大家用甚麼角度在討論柯文哲, 而

1. 這分享包括狀態的分享與照片的分享, 但前提是分享.
2. 若這分享若是非公開的, 將不會顯示.
3. 因為計算的關係, 會有 30 分鐘到兩小時的落差.
4. 若只是個人的動態或照片, 若沒經過被分享或公開不會被採集.

當然這些資料有用, 也更希望大家用, 所以就做成 API, 就把這網址所須要的資料包成 json 給大家來用, 資料讀取是:

http://kwj.board.tw/api/kwj.php?apikey=[Your API KEY]

這邊有 post_id, 格式為 [fbid]_[post], 這是原始的 FB 資料, 而要轉成真正的網址必須解成:

https://www.facebook.com/permalink.php?story_fbid=[fbid]&id=[post]

只是這種連結方式不見得每次都有效, 不知道有誰有更好的 post_id 的轉網址方式...

其中的 API KEY 是透過林克傳說授權的, 也就是要在這連結 http://link.que.tw/apikey.php , 取得你的 API KEY 就可以用了, 不用經過認何人工的流程.

現在開放測試, 若有甚麼問題請跟我說:

2014年9月16日 星期二

我心目中八年後市長候選人現況的 20 個項目, 每一個都很重要

這幾十年來, 我一直在想, 為甚麼政治一定非要有專業的政治人物來擔任不可, 雖然說不是須要所謂的 "素人" 來從政, 但我心目中的候選人應該如何呢?

我一直認為這個人應該是本來就是在做對社會有貢獻或有意義的事, 雖然那個人不見得一定要一直在非營利組織工作, 但除了賺錢的工作外, 這個人應該是持續得對社會努力與貢獻, 雖然不見得是那組織的領導者.

也就是說, 這個人不見得是一定非得從民意代表出身, 但由於這個人參與社會超過 10~20 年的經驗, 能夠對我們存在的社會有一定的想法, 且不會容易受到金錢或權利所誘惑, 這樣的努力與奉獻, 是須要我們透過選票讓這個人有機會做出更多的事情才對, 即使最後沒有選上, 這個人應該也是能夠回歸到原本的角色繼續實現願望.

所以跳脫連勝文, 柯文哲, 馮光遠或其他四位候選人, 我在想, 若是有一個人是我心目中八年後市長候選人, 那個人現在會是在做甚麼呢?

我就嘗試的列下來吧.....

1. 她曾在一個非營利組織任職
2. 她帶領一個很聰明的團隊
3. 即使剩下她一個人, 她也可以把事情做出來, 但她可以領導團隊做的更好
4. 這非營利組織最好是跟居住正義, 交通, 人權, 教育有關

5. 她願意把組織運作給透明化
6. 她有從最基層做起的經歷
7. 她現在至少正在帶領 10~100 人團隊
8. 她能夠動手做出作品, 且這專長不是須要架構別人之上

9. 她在網路上的發言大部份不假他人
10. 她會承認她做錯很多事或說錯很多話
11. 她不須要很高的學歷或很聰明, 但她在 10 年內還是在進修
12. 她的資產不會在前 5%, 但她的薪水有可能是在前 20%

13. 她最好不是權貴後代
14. 她認為人在任何情況不應該被性別, 宗教, 血緣所區分或限制
15. 她有一半的交通是用大眾運輸系統
16. 她會很喜歡玩遊戲, 或是在興趣嗜好有認真的投入

17. 她會有一個部落格或專欄來闡述自己的想法
18. 她會讓大家知道她喜歡的小說, 電影, 音樂, 或者是球隊
19. 她不須要有很遠大的夢想, 只想要有一般的生活
20. 她認為這世界的每一個人都是很渺小, 但也很重要與價值

阿, 還有....

21. 她不一定是個男的

若是你的話, 雖然你現在不見得是支持那一個候選人, 你會列出你心目中八年後的市長候選人的現況會是如何呢? 嘗試的列出個 10~20 項吧....

若你寫出來, 就加個 Hashtag: #我心目中的市長候選人 讓大家一起討論吧....

2014年9月15日 星期一

從行動代號 MG149 來看台北市長選情的 911 轉戾點

選戰早就過了到數 100 天, 本來以為這次的選戰應該沒甚麼烽火漫延, 峰迴路轉的事情, 但隨著這次的行動代號 MG149 就變得完全不一樣...

在林克傳說的資料中, 我們將大家分享的文章分成六類: (支持|反對)(柯文哲|連勝文|馮光遠) 若是用 Regular Expression 來表示的話, 大約從去年 10 月就開始記錄, 此時可以分成幾個時期:

1. 去年10月到今年1月: 此時主要的聲量都是一面倒的支持柯文哲, 偶而有零星的支持馮光遠或反對連勝文的聲量出現.

2. 今年 2 月到 318 期間: 前期反對連勝文的聲音到處出現, 後期支持連勝文的輿論慢慢加溫.

3. 318後一個月: 此時應該沒有人理這三位候選人吧

4. 4 月到選前 100 日: 這段時間反對連勝文, 支持柯文哲, 支持連勝文互相競爭, 各有極大值成為排行第一名的狀況, 而最高值是 反連 47% vs 支柯 35% vs 支連 22%.

5. 選前 100 日到 9 月 10 日: 支持柯文哲突破 50% 到 56%, 反對連勝文也曾到 50% 高鋒, 甚至支持連勝文的也到 49% 的高鋒, 這三個部份的聲量還是互相爭最高, 除了支持連勝文有一天最高過, 其他都是支持柯文哲與反對連勝文互爭最高.

(上圖為最近 200 天的林克傳說截圖)

但在 9 月 11 日時, 整個 行動代號 MG149 PK 事件到了第二天, 反對柯文哲的聲量第一次成為最高, 雖然只有 25%, 但比起其他的 5 種聲量的確最高, 此時選戰已經到了短峰相接的時刻了, 而我那天原本想寫一篇文章來講述 MG149 不是個可以放著不回應的事, 但我相信此時對柯文哲的支持者是個大震撼.

只是過了一天整個選情又不一樣了, 大概是連陣營的羅委員雖然努力的想追打 MG149, 但犯了幾個很糟糕的錯誤整個局勢完全逆轉, 套句民報說的: 反作用力?MG帳戶案殺過頭 挺柯力量漸集, 此時整個柯陣營的網路支持者 (簡稱柯網軍) 大暴發, 扭轉整個局勢, 反對連勝文的聲音達到 81% 的高峰, 甚至柯文哲支持的聲音也回溫到 54%.

拉回來這段時間, 雖然反對柯文哲的聲音是極大化, 但現在又慢慢消退, 但支持連勝文的討論是一點都沒有被拉抬, 一直維持著 20%~25% 的狀況, 這可能代表著這種選戰打法是無法激起支持者的聲音, 反倒是因為一不小心的錯誤變成全盤皆墨.

(下圖: 最近 10 天的截圖)


但現在說選戰已經有結果還早, 畢竟很多事情都是訊息萬變, 但透過這樣的工具, 倒是可以更看得清楚選戰是真的.

這圖表大家可以去林克傳說直接看, 或直接去與 UDN 做的選戰溫度計查看.

網址為: http://udn.com/vote2014/trend#trend_chart02

2014年8月19日 星期二

內容農場真的在傷害社會嗎?

昨天, 在台灣社群排行榜的前 10 名, 有 6 名是內容農場, 甚至可以說是 6 + 0.5 + 0.25 = 6.75 都可以, 其中包含可以討論的 A Day Magazine 及 ETtoday 的鍵盤大檸檬, ....

會出現這樣也是因為其中有 boMb01 的出現, 加上 sos.tw 加入戰局所造成的, 其中最有趣的是 sos 聯盟, 包含下面幾個:

救命阿 SOS.tw 內容農場
petstube.tv 內容農場
sport01.tv 內容農場
kuso01.tv 內容農場
e04.tv 內容農場
boMb01 內容農場 (?)

上面這四個網站是共用一個 Google Adsense 的廣告主及版型, 而 boMb01 跟前四個是在同一個機房, 就命名原則應該也是同一個公司做的.



雖然說內容農場很可怕, 但比較麻煩的事這些人都是有關係或是同一組人, 而且大量的在產生內容與網站, 且在了解如何操作 "下標", 所以分享與連結是相當的可怕, 因此雖然說 10 名中有 6 名是內容農場, 但在 50 名中只占 10 名, 也就是說集中在前 10 名.

即使是看起來數目不多, 但瓜分了不少的社群流量, 基本上甚至可以說是 "賺很多", 在這種成本不是很高的情形下, 都可以推估一篇文章的廣告數可以賺到 2~5 萬元以上, 而成本極低, 因為跟本不是原創或經過授權.

在這邊定義內容農場是, 依最新或最多分享的 10 篇文章中:

1. 有 8 篇以上不是原創, 也就是說有 3 篇是其站內作者署名原創.
2. 有 6 篇以上是宣稱授權, 也就是說有 5 篇是有獲得原作者的授權.

只要同時符合作兩個條件就才會被劃分內容農場, 這麼嚴格的定義還是有不少網站被劃為內容農場, 因為事實上本質上他們就是想賺 "Easy Money".

當然社群的 "眼球時間" 是有限的, 當內容農場賺取了不少流量與廣告, 相對的認真創作的網站就被剝奪了獲得收益的機會, 說內容農場沒在傷害是不可能的, 更何況大部份的內容都是 "錯誤" 的, 基本上都是以偏蓋全, 危言聳聽, 因為這樣才能夠獲得更多的分享與討論.

雖然現在已經幾個朋友宣稱, 只要他的朋友分享內容農場的文章就刪好友, 但還是有人持續的在分享這些網站, 因為有太多人沒有意識到他們在散播有問題的內容, 無論就內容或是型式上的.

或許要求內容農場不去賺 "Easy Money" 是不可能, 就像是要求販毒過的人不再販毒一樣, 他們會問你除了這方式外, 還有比這更好賺的嗎? 只是不一樣的是我們可以停止分享來讓他們的利益減少, 至少在動機上他們會少很多, 這比透過任何法律或道德方式都更有意義, 不是嗎?

熱門文章