有在追我臉書的人都知道我最近在做林克傳說, 這是一個用來讓大家知道現在臉書分享連結的分析系統, 其中完成的過程是:
1. 以個人做出發, 那些訊息是我朋友分享最多的, 依一定週期的次數次序來排
2. 目前系統所有人在一定時間內塗鴉牆分享數的排序 (A)
3. 從分享連結的網站, 來看這個人的閱讀息性 => 資訊來源偏離度
4. 我的朋友中, 各個屬性的排行榜 => 想知道誰真正的本質嗎?
5. 計算出真正的熱門話題的擴散性, 而不是只是算分享數的轉換 (B)
6. 我應該找誰討論 => 從閱讀網站的屬性找出跟你最相似的閱讀者
7. 計算出話題與真實臉書的比例轉換公式 (C)
其中有一個相同的 A => B => C 就是從分享數算到熱度算到真實的比例, 這過程看起來簡單, 但也花了快 3 個星期 (從11月1日做到現在), 而我之前說的, 這七個子系統, 都只是 "副產品", 真正的第一個產品應該是:
"系統是否能夠即時的提示我那些資訊變熱門?"
雖然這個在以 "個人" 為出發的前提下, 不是個好系統, 但對於 "資訊匱乏恐慌症候群" 的患者, 是一個很大的福音 (?), 這也是第一個有 Notification 的功能, 更也是最值得做成 App 的資訊.
這系統是讓使用者選擇 10%, 20%, 30%, 50% 之類的比例, 這比例指的是 "這訊息出現在使用者塗鴉牆占所有使用者的比例(台灣)", 當某個分享超過這個比例就會出現在這列表當中, 當然這也可以做成像訊息列那樣, 有已讀與未讀, 所以更可以做個功能: 放大絕 (所有設成已讀), 這樣我相信一定可以讓病情 (資訊焦慮症患者) 降低一些些...
當然就我的個性我不希望讓系統成為 "單向度/同質性" 太高的閱讀行為, 所以一定會以個人做出發, 只是現在是在做觀察, 因為在我認知的訊息密度一定是介於一個可以調整的系統:
1. 一天一則最值得看的訊息
2. 一天十則最值得看的列表
3. 一週10則最值得看的清單
4. 一週只看一則有甚麼最值得看的
除了讓人可以選擇訊息密度外, 且有三個選項:
1. 全部相同的觀點
2. 依你閱讀習慣的觀點
3. 更有價值的觀點
這系統自然是希望完成第三點, 但也是最困難的點, 因為這個 "價值" 有時是很難定義的, 因為這有時會遷涉到價值觀等的主觀判斷, 但也不是說完全做不到, 例如可以用 "你期望的典範 Role Model" 來去趨近 (Approach), 當然現在系統已經一步步完成, 在第二點還在做微調的情型下, 第一點是最簡單可以完成的.
我相信很多人到現在已經看得霧煞煞, 那麼單純的一個 "分享" 數數系統可以變得那麼複雜, 這也是 Data Mining (Big Data?) 困難的地方, 看起來很簡單, 但須要很複雜的流程才能做到, 看起來那麼不可行, 確又可以用 "量" 去產成出有 "質" 的東西.
這也可以證明一個真的可以實用的系統, 在做出之前, 的確可以做出不少有趣的 "副產品", 往往有這副產品的經驗, 才可以讓真正的主產品完善, 尤其是這種大量資料的計算, 就像是我之前有提到, Facelab 的這個 Project, 要做出能夠真的靠臉來判斷人的工具, 真的在實用化之前必然有很多 "副產品", 之中最有名的就是 "Meet the world's Mrs Averages: Scientists blend thousands of faces together to reveal what the typical woman's face looks like in 41 different countries from around the globe" (41 個不同國家女性的典型長相) 這個成果, 所以這篇文章用的圖是這個 Lab 10 個成員的 "Average Face".
當然有 Average, 也要去講 "Unique", 所以原本這網址要改名的, 但最後還是延用 que.tw, 只是取的不是 Unique, 而是 Quest, 因此也真的真除 "林客傳說(探索)" 這計劃名.
寫到這邊, 又忘了給大家網址: http://link.que.tw/new.php, Have Fun!!!
訂閱:
張貼留言 (Atom)
熱門文章
-
剛不小心去按 plurk, 發現跑出一段 error code: Traceback (most recent call last): File "/home/plurk/plurk/production/releases/20090104210908/ext/part...
-
當我們做出一個系統, 最希望知道的是有沒有檢定判讀的能力, 不然價值與意義就會少很多, 而在做未來國會的時候, 很多人問我, 網路聲量是否能夠轉化成得票數? 事實上我也是很好奇.... 首先一開始, 就直接算出得票數與網路聲量的相關性 (相關係數), 得出來的答案是: ...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
會取名網事是有原因的, 不單純的只是 "網站的事情", 也是因為我習慣用雙關語與諧音來命名的關係, 因此這個 "往事" 也代表來看過去, 從看過去的事, 來做現在的事, 因而決定未來. 因此會有一個很有趣的功能, 也就是我很喜歡的數...
-
在這個 Blog 我的定義是, 只要是常常被人問的問題, 若又被人問及的時候, 我就會寫篇文章叫他過來看, 而不是我再講一次, 畢竟每個人都要講一次也挺累的, 所以才叫 "Gene Oral Speaking", 本質上是說話的內容, 轉到 Blog 來寫作或...
-
目前已知道 Formula/Equation 是: 1. Unemployment: ind*3+com-pop (分母是Pop) 2. Transportation: tra*5+100-pop (分母是Pop) 3. Criminality: sec*4+300-pop (分...
-
在現在許多大學生都不知道的 20 年前, 我們是沒有大學法的, 不要說是大學學生只能聽從 "有三種人是沒有自由" 的說法, 大學教職員也受制於教育部, 而在我們那一年代, 網路還不是很興盛的時候, 站出來說話的成本很高, 不是要貼大字報, 就是要發傳單, ...
-
我剛去看 iTHome 的部落格後台, 看有那些連結連到我章, 其中一個大陸的 Google Search 我點下去看時愣住了... "點點看" 結果出現: G o o g l e 錯誤 很抱歉... ...您的查詢疑似來自電腦病...
-
依 IMDB 超過 1 萬人以上評分的順序 降世神通 1. 9.3 Avatar 降世神通 2. 9.2 Ricky and Moorty 3. 9.1 鋼之鍊金術師 Brotherhood 4. 9.0 進擊的巨人 5. 9.0 獵人 6. 9.0 死亡筆記本 11. 8.8 ...
-
民進黨為了要決定提名,因此辦了民意調查,來決定候選人,而公布高雄市的民調時,嘗試跟 "專頁儀表板" 做了個比較,發現相關性達到 0.99 以上這個令人吃驚的事,但第二天台南的民調跟專頁儀表板的相關性只有 0.03,這數字可以說是完全無關,而 0.99 的相關性...

沒有留言:
張貼留言