2014年8月8日 星期五

臉書導流到網站的排行榜 social.board.tw

網址:  台灣社群排行榜

在經營網站時, 一定要知道網站的流量來源, 其中可以分成幾類:

1. 短期 : 社群, 廣告, (3 小時到 3 天), Buy(主)/Earn
2. 中期 : 搜尋, 轉介, (3 週到 3 個月), Earn(主)/Buy
3. 長期 : 直接, 訂閱, (3 個月以上), Own(主)/Earn

現在最被重視的流量來源就是社群了, 甚至出現只靠社群經營的網站, 尤其是內容農場之類的網站, 直接跳過中長期經營, 只做直接有效的短期經營, 也因為這種快速的 Easy Money, 即使不見得都是違法, 但的確存在有些人被侵犯的事.

林克傳說是以社群網站(臉書)中使用者分享連結的觀察系統, 而在建立起來後, 已經可以看到台灣網路使用者如何透過分享來看內容, 其中包含新聞及其他內容, 在有足夠有效度的資料之後, 就可以直接進一步的不靠抽樣獲得較完整的資訊, 就是臉書分享排行榜.

這系統有幾個步驟去完成:
1. 獲得使用者的授權
2. 搜集使用者看得到的動態牆
3. 合併相同內容但不同網址的連結
4. 計算此連結的覆蓋率
5. 排程抓取這些種子連結的臉書數值
6. 推估每天的數值
7. 計算排行榜
其中前四項林克傳說已經完成了, 後三項看起來簡單, 但排程與推估這件事情是沒那麼簡單, 這部份從開始寫到定案大概改了二十次以上的演算法, 其中也嘗試著算出第一版的 "那些網站最被台灣網友分享與按讚?", 但當有人指出有問題時, 我也發現有更多可以改善的地方, 所以又停下來重整, 所以貼出 "[林克傳說] 有關臉書社群榜", 再做些基礎工夫後會更準確.

即使真的算出這個網站可以透過社群獲得多少流量, 但別忘了這才是目前主要流量來源的一種 (社群, 搜尋, 轉介, 直接), 雖然有些網站不到一成來源來自社群, 但也有超過七八成流量來自社群的網站, 就像 "媒體在社群網路的消長分析 (2014前半年)" 所說的, 即使是新聞網站, 有的是 4 成來自社群, 也有不到 2 成的, 差距是超過一倍以上, 甚至是明明社群流量大過別人, 但總流量卻輸如, 或者是相反, 因此可以知道每一個網站屬性都是不太一樣的.

在之前, 大家看社群都是看粉絲團, 從看粉絲團的人數, 看成長數, 看每則動態消息的讚/分享/評論的數字及觸及數, 但這些都無法產生價值與效益, 因為最後還是要看真正回流到網站後, 對點擊與閱讀產生的廣告效益等等, 雖然粉絲團的經營是個先驗, 是個領先指標, 但最後還是要回到網站本身, 所以最後有人跟我說, 林克傳說的數字跟他們差距相當大, 原本以為是算錯, 所以經過努力把精確度提升, 但還是有人說完全不一樣, 此時才發現這是兩個不同角度的事.

粉絲團的 Insight: 透過粉絲團經營與動態消息的排行榜與分佈, 可以知道這個網站在臉書的活躍度.
台灣社群排行榜: 透過網站本身在臉書的按讚/分享/評論, 知道使用者透過個人動態消息的傳播狀況.

很明鮮的這是兩個完全不同的觀點, 不同的來源數字, 舉個例子來說好了, 蘋果日報粉絲團貼出 "高市​早知榮化奪命管線 陳菊鞠躬道歉" 這動態消息, 這則動態獲得了 52,470 個讚, 1,036 個分享及 2,152 個討論, 加起來超過 5.5 萬個觸及數, 但在網站上這則新聞同一時間的數字是 1.3 萬, 其中是 11,311 個讚, 612 個分享, 1,936 個評論, 加起來是 13,859 個觸及, 也就是 1.3 萬, 若是要看經營粉絲團的成效, 看的是 5.5 萬, 但若是要看網站在社群的效應, 則是 1.3 萬, 這是兩個不同的觀點.

大家可以看下面的截圖的數字就可以知道, 左邊是粉絲團, 右邊是網站:



而這系統是以經營網站的觀點優先於經營粉絲團, 所以計算的是網站的效應, 而非粉絲團的效應, 所以這數字跟 Insight 有段落差, 就像是蘋果日報的粉絲團經營的很好, 若是看 Insight 絕對是比 ETtoday 好上很多, 但 ETtoday 經營的就不只限於一個粉絲團, 而看的是帶來的網站效應, 最後對應到 SimilarWeb 來看, 果然 ETtoday 社群佔比比蘋果高, 但話說這之間差距不大是真的, 只是就單一粉絲團經營成效比就差很多了.

這個排行榜的目的就是看社群的導流效果, 當然用按讚/分享/評論數不是絕對的, 但也是可以推估個蛛絲馬跡, 因為最後網站的總流量還是要加其他來源.

原本排行榜是把七天內獲得的 "讚/享/評" 這三個數字加總, 但發現按讚的數字比分享評論大上 9~10 倍, 也就是說只看按讚就決定了, 但實務上較重要的是分享, 因為這會影響到真正的覆蓋率, 只是按讚更是人最初發的行為, 不能完全不算, 所以最後把這數字加權加總後來排除排行榜.

只是這數字差距還是相當大, 第一名跟第一百名數字是相差一萬倍, 因此最後還是取對數後做正規化 (Normalization), 而讓大家比較好閱讀, 若你是較專業的分析師, 可以用 origin=1 的參數, 來看完全沒加權, 沒取對數的數字, 來跟你手上的數字做驗證是否正確.

最後加上跟前一天的排名, 分數做比較, 也提供到 Alexa 與 SimilarWeb 的連結做檢驗, 接下來會做的是將之分類, 但這些就須要較多的人工了, 雖然加註中文也花了不少時間.

會做這排行榜只是想分析媒體, 或是想去觀察內容農場, 後來經過某位知名的 XXC 好朋友, 他在想說如何更領先知道一個網站的暴發與成長, 在做之前, 一定要有基本資料做比較, 所以這排行榜就出來了, 所以是希望做出來對網站經營者, 媒採與廣告主, 及社群的大家有所幫助.

沒有留言:

張貼留言

熱門文章