昨天一直被 James Skiky Hsiao 說林克傳說是一個很可怕的東西, 但畢竟工具是獨立的, 沒有善惡對錯, 無論做出來是可以成為鏟除萬惡的海軍軍艦, 還是變成給海賊王用最自由的海盜船, 這系統只能努力發展, 並不做任何假設....
經過跟李柏鋒與闇月鏡的討論及 co-work 後, 臉書連結分享排行榜勉強到達一個可以看的狀況, 且準確度也慢慢滿意了, 而昨晚完成的儀表板幾乎就是一個很實用的結果, 若有在追蹤我臉書的動態消息, 就知道這是一連串的改進的實作.
目前在林克傳說中, 看到有關 "分享" 的數字, 點進去就可以看到這個儀表版 (Dashboard), 其中分成幾個...
1. 基本資料: 包含第一週的曲線與分數, 包含擴散力, 以及三個主要的傳教士, 有關聯的關鍵字, 以及有關聯的連結.
2. 回看討論: 看到這個連結在分享時所發表的意見, 但過濾掉非公開的資訊.
3. 72小時線圖: 每小時的讓你看到這連結的臉書狀況
4. 一週日線圖: 除了可以看到第一週的資料, 也可以改成看到今天的線圖
5. 歷史資料: 這系統目前去臉書抓資料的詳細資料, 這是用來除錯用.
而在基本資料中, 有兩種分數要在這邊解釋:
1. 第一天與第三天佔比: 是指這個連結到現在, 第一天時與第三天所佔的比例, 通常前三天佔的比例不到 100% 或更低, 表示第四天之後還是有人持續的在按讚與分享, 評論, 也就是說這系統活得較久.
2. 擴散力: 由於前個分數會因為時間的推移改變, 也是以最新的資料去算, 即時參考的分數, 但要做檢討的話必須要是一個固定的數字, 因此擴散力是一個在固定前七天中, 那時累積 100% 的觀點, 前六天跟 100% 差距的百分比總和.
在這邊擴散力是一個理論值最高 100 分, 但實務上是 0~200 分的數值, 就觀察這擴散力的價值如下:
1. 50 分以下: 代表這連結幾乎沒有擴散力, 前三天之後就停止散播的狀態.
2. 50~100 分: 正常的連結, 第三天以後還是有人在分享.
3. 100 分以上: 最高可能不見得是第一天, 往往第二天與第三天之後還是有很強的力道.
但目前這幾個數字會出現前題是系統能夠在第一天就抓到資料, 有些連結的分享一開始較緩慢, 說不定到第二天第三天才會被計算時, 就無法計算這分數了.
而在李柏鋒的建議下, 算出這個連結最主要的三個傳教士, 也就是被最多人看到的分享者, 因為在實務上最有價值的是傳教士, 而不是第一個分享的意見領袖, 但寫到這邊覺得也是可以列出來.
而在商姐的發想下, 做出關聯文章的關鍵字分布, 從這邊可以看到這連結分享的因子分析, 其中包含是因為甚麼樣的議題, 甚麼樣的媒體, 那一個作者, 那一種族群的人在分享, 例如可以知道像這則討論有關 "馬後砲" 的事情導出一些人名, 只是這部份還要再做調整, 畢竟從關鍵字做分析到真的見解還是須要 "工人智慧" 的解讀.
最後就是關聯文章, 也就是分享這個連結的人也分享那些連結, 這也是資料探勘 (Data Mining) 的 Relation Analysis 出來的, 當然也做過這連結被多少人連結的正規化 (Normalization), 最後只呈現最近兩個月的連結, 因為人只對最近的新聞有感覺, 但還是有一個選項可以列出所有的連結.
上圖的圖例是取自 想捏爆可愛小動物的衝動是正常的嗎? | PanSci 泛科學 基本資料, 可以看得出來這連結第一天就抓到資料, 且到第三天還是有很多人分享, 所以擴散力超過 100 分, 主要傳教士除了泛科學粉絲團之外還包含鄭國威等人, 因子包含泛科學這媒體, 放生這關鍵字, 郭采潔與張德正這兩個人名, 而看後面的關連連結很明鮮多是科技科學相關文章, 以及科技大觀園, 科學不一樣等等網站.
這系統目前說實在的也只能說是 Preview 版, 也就是比 Alpha 好一點點, 所以請大家不吝給我意見與討論, 說不定我可以想到一種方法解答你的想法與問題.
訂閱:
張貼留言 (Atom)
熱門文章
-
以下的言論, 純以我是以一個工程師出身的網管, 也以做過 ISP 基礎建設的工作經驗來發言. 前一陣子有人提出取消手機網路不應該有吃到飽 (Flat Rate) 的奇想時, 有參與網路發展的人都知道, 這個固定費率的使用量是網路發展的推手, 或者是指標, 甚至是門檻, 若把這...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
專頁儀表板除了作為社群編輯的工具外,更想做的是想要成為 "透過社群來了解社會" 的儀表板,因此對於 "屬性" 上做了各個面相的定義,除了常見的分類外,更重要的是依立場,議題來去 "標籤"。 因此會有 "...
-
一些無聊晃進來的朋友應該有發現, 左上角多了幾個之前沒看過的 gadget, 因為我又開始做無聊事了... 看到許多人裝 Google Friend Connect, 而我個人對較為開放的 Protocol 是採較為正面的態度, 所以就裝起來玩玩看, 覺得這是一個可以發展的東西,...
-
有人問我這次一例一休本來一開始民進黨如此的強勢, 但為甚麼如此呢? 記者對一例一休的文章數, 可以看到在 10 月之前有還是有在露出, 但在 10 月底才開始加碼... 主要是社群一開始沒甚麼熱度, 一直到 10 月底才開始... 即使是評論...
-
在兩三年前, 跟 "史公" 聊到一個有趣的問題, 就是他感嘆台灣教育在結構上有很大的問題, 大部份的大學教育, 其課程都想教人成為頂尖的人物, 例如 "李安", 且很多學生也都的確以這為目標, 但我們都知道, 李安在沒當導演之前, 也當過好...
-
大家還記得我在兩個月前寫了一篇 " 如何用網頁到網頁的延伸閱讀, 取代網站的交互連結 " 的文章嗎? 裏面談到兩個可能的發展性: 1. 共通 Tag : 這個沒甚麼了不起, Technorati 就是如此, 雖然這是很好的東西, 可惜沒人用了, 只是...
-
一些比較消息靈通的人都知道 Seednet 做了一個 TaiwanRank, 以自己用戶的使用狀況來作網站的另一種排名, 而目前推出的指標是 DNS 查詢數 及 不重覆IP 的兩個排行.. 有人問我這樣到底準不準阿? 事實上我常說, 沒有一種指標或觀點能夠覆概所有事情, 當然是越...
-
我是不做 "Me,too" 的, 但我知道粉絲團經營最重要的共同指標, 一個是觸及數, 另一個是互動數, 但這數字只有經營者知道, 即使從洞察報告可以看到你加觀察的幾個粉絲團, 最近文章的互動狀況, 但還是離真的狀況有點距離, 除外粉絲團可以比較的就是 ...
-
"若有一個像噗浪一樣好用的系統, 但有小圈圈的功能, 我二話不說一定會跳過去..."---- GH404X, 2009 (噗浪第一年) 在 Google+ 襲捲台灣不到兩個星期, 噗浪在 Alexa 跌了一名, Twitter 留言銳減, Facebook 有...
沒有留言:
張貼留言