有在追我臉書的人都知道我最近在做林克傳說, 這是一個用來讓大家知道現在臉書分享連結的分析系統, 其中完成的過程是:
1. 以個人做出發, 那些訊息是我朋友分享最多的, 依一定週期的次數次序來排
2. 目前系統所有人在一定時間內塗鴉牆分享數的排序 (A)
3. 從分享連結的網站, 來看這個人的閱讀息性 => 資訊來源偏離度
4. 我的朋友中, 各個屬性的排行榜 => 想知道誰真正的本質嗎?
5. 計算出真正的熱門話題的擴散性, 而不是只是算分享數的轉換 (B)
6. 我應該找誰討論 => 從閱讀網站的屬性找出跟你最相似的閱讀者
7. 計算出話題與真實臉書的比例轉換公式 (C)
其中有一個相同的 A => B => C 就是從分享數算到熱度算到真實的比例, 這過程看起來簡單, 但也花了快 3 個星期 (從11月1日做到現在), 而我之前說的, 這七個子系統, 都只是 "副產品", 真正的第一個產品應該是:
"系統是否能夠即時的提示我那些資訊變熱門?"
雖然這個在以 "個人" 為出發的前提下, 不是個好系統, 但對於 "資訊匱乏恐慌症候群" 的患者, 是一個很大的福音 (?), 這也是第一個有 Notification 的功能, 更也是最值得做成 App 的資訊.
這系統是讓使用者選擇 10%, 20%, 30%, 50% 之類的比例, 這比例指的是 "這訊息出現在使用者塗鴉牆占所有使用者的比例(台灣)", 當某個分享超過這個比例就會出現在這列表當中, 當然這也可以做成像訊息列那樣, 有已讀與未讀, 所以更可以做個功能: 放大絕 (所有設成已讀), 這樣我相信一定可以讓病情 (資訊焦慮症患者) 降低一些些...
當然就我的個性我不希望讓系統成為 "單向度/同質性" 太高的閱讀行為, 所以一定會以個人做出發, 只是現在是在做觀察, 因為在我認知的訊息密度一定是介於一個可以調整的系統:
1. 一天一則最值得看的訊息
2. 一天十則最值得看的列表
3. 一週10則最值得看的清單
4. 一週只看一則有甚麼最值得看的
除了讓人可以選擇訊息密度外, 且有三個選項:
1. 全部相同的觀點
2. 依你閱讀習慣的觀點
3. 更有價值的觀點
這系統自然是希望完成第三點, 但也是最困難的點, 因為這個 "價值" 有時是很難定義的, 因為這有時會遷涉到價值觀等的主觀判斷, 但也不是說完全做不到, 例如可以用 "你期望的典範 Role Model" 來去趨近 (Approach), 當然現在系統已經一步步完成, 在第二點還在做微調的情型下, 第一點是最簡單可以完成的.
我相信很多人到現在已經看得霧煞煞, 那麼單純的一個 "分享" 數數系統可以變得那麼複雜, 這也是 Data Mining (Big Data?) 困難的地方, 看起來很簡單, 但須要很複雜的流程才能做到, 看起來那麼不可行, 確又可以用 "量" 去產成出有 "質" 的東西.
這也可以證明一個真的可以實用的系統, 在做出之前, 的確可以做出不少有趣的 "副產品", 往往有這副產品的經驗, 才可以讓真正的主產品完善, 尤其是這種大量資料的計算, 就像是我之前有提到, Facelab 的這個 Project, 要做出能夠真的靠臉來判斷人的工具, 真的在實用化之前必然有很多 "副產品", 之中最有名的就是 "Meet the world's Mrs Averages: Scientists blend thousands of faces together to reveal what the typical woman's face looks like in 41 different countries from around the globe" (41 個不同國家女性的典型長相) 這個成果, 所以這篇文章用的圖是這個 Lab 10 個成員的 "Average Face".
當然有 Average, 也要去講 "Unique", 所以原本這網址要改名的, 但最後還是延用 que.tw, 只是取的不是 Unique, 而是 Quest, 因此也真的真除 "林客傳說(探索)" 這計劃名.
寫到這邊, 又忘了給大家網址: http://link.que.tw/new.php, Have Fun!!!
訂閱:
張貼留言 (Atom)
熱門文章
-
明明所謂的政治是所有人的事, 但在權力與媒體運作的情型下, 感覺政治只有政治人物才玩得起的遊戲, 難到真的是這樣嗎? 從臉書的掘起, 粉絲團現在變成所有政治人物展現實力的一個場所, 甚至現在的選戰運作理論分成三種力量: 1. 陸軍 : 看政治人物自己的實力, 人脈, ...
-
在標題應該是這樣子的: (我的(你的(我的小城市))), 因為是在想我如何使用 (你我的小城市) 這個系統~~~, 當然還是在講 MyMiniCity .. 有點繞口.. 首先先講不是我做的部份, 在 Create My City 的 Forum 看到一篇, A List of ...
-
Weather.DataMining.Tw 做了一個多月了, 這代表資料也搜集一個多月了, 已經幾乎到可以發表的狀況了, 且有個記者朋友也真的寫了篇採訪稿, 但他跟我們講中央氣象局的人說我們的資料有問題, 我一面岔意一面檢查, 果然資料真的有問題. 雖然在這種抓資料的程式, 最麻...
-
很少在標題直接破題的, 因為說當天要寫的, 一晃眼又過了一個月, 雖然現在是比較心平氣和的看這件事情, 但有時還是會有點無奈. 這件事是發生在某個研討會上, 而大家都知道部落格觀察或部觀門都是看誰說得好, 大家在說甚麼的系統, 包含之後的 Plurk.tw, 我一直對於 Data...
-
在 Search Rank (SEO) 納入 Users Signal (使用者訊號) 之後, Click Through Rate (CTR) 變成了一個不在只是 UI/UX 的最愛, 更是 SEOers 不得不提的事了. 當然 CTR 不是只有注重 SEO 的人才須要注意...
-
標題這句話怎模說呢? 在這次地震之前, Page Rank 是 6 的部落格有 15 個, 而算到剛剛, 目前有 13 個部落格的 PR 值是 6 分, 且其中有 7 個部落格是進步到 6, 這句話是說, 原本的 15 個 PR=6 部落格中, 只有 6 個是保持不變的, 這句話...
-
用了 3.5G 以後, 最大的問題是若是沒有正常慢慢退出的話, 很有可能因為系統認為虛擬光碟還在, 所以不讓你休眠.... 所以此時比較好的方式就是先登出後再休眠, 只是要花較久的時間.. 而昨天當我按休眠後不給休眠, 我就按開關 7 秒鐘後直接關機, 沒想到第二天慘劇就發生了,...
-
上一篇還有很多沒寫到的地方: 1. 在最初的規劃這個數字是 Increamental 的, 也就是為了避免沒有抓到資料時的問題, 而這三種數字有兩個是一直增加的, 一個卻是在變化的. 2. 在第二組的距離, 事實上最後應該只會採用一個, 做一下 x*y*z 應該對資源影響不大. ...
-
這篇報導是在 http://tw.news.yahoo.com/article/url/d/a/100809/11/2ar0a.html 這裏, 到中午, TWNIC 的人就一直打電話給我, 而我還在會議中搞不太清楚是甚麼, 但就大意上面指的都是講了很多有問題的話, 而我一上...
-
民進黨為了要決定提名,因此辦了民意調查,來決定候選人,而公布高雄市的民調時,嘗試跟 "專頁儀表板" 做了個比較,發現相關性達到 0.99 以上這個令人吃驚的事,但第二天台南的民調跟專頁儀表板的相關性只有 0.03,這數字可以說是完全無關,而 0.99 的相關性...
沒有留言:
張貼留言