有在追我臉書的人都知道我最近在做林克傳說, 這是一個用來讓大家知道現在臉書分享連結的分析系統, 其中完成的過程是:
1. 以個人做出發, 那些訊息是我朋友分享最多的, 依一定週期的次數次序來排
2. 目前系統所有人在一定時間內塗鴉牆分享數的排序 (A)
3. 從分享連結的網站, 來看這個人的閱讀息性 => 資訊來源偏離度
4. 我的朋友中, 各個屬性的排行榜 => 想知道誰真正的本質嗎?
5. 計算出真正的熱門話題的擴散性, 而不是只是算分享數的轉換 (B)
6. 我應該找誰討論 => 從閱讀網站的屬性找出跟你最相似的閱讀者
7. 計算出話題與真實臉書的比例轉換公式 (C)
其中有一個相同的 A => B => C 就是從分享數算到熱度算到真實的比例, 這過程看起來簡單, 但也花了快 3 個星期 (從11月1日做到現在), 而我之前說的, 這七個子系統, 都只是 "副產品", 真正的第一個產品應該是:
"系統是否能夠即時的提示我那些資訊變熱門?"
雖然這個在以 "個人" 為出發的前提下, 不是個好系統, 但對於 "資訊匱乏恐慌症候群" 的患者, 是一個很大的福音 (?), 這也是第一個有 Notification 的功能, 更也是最值得做成 App 的資訊.
這系統是讓使用者選擇 10%, 20%, 30%, 50% 之類的比例, 這比例指的是 "這訊息出現在使用者塗鴉牆占所有使用者的比例(台灣)", 當某個分享超過這個比例就會出現在這列表當中, 當然這也可以做成像訊息列那樣, 有已讀與未讀, 所以更可以做個功能: 放大絕 (所有設成已讀), 這樣我相信一定可以讓病情 (資訊焦慮症患者) 降低一些些...
當然就我的個性我不希望讓系統成為 "單向度/同質性" 太高的閱讀行為, 所以一定會以個人做出發, 只是現在是在做觀察, 因為在我認知的訊息密度一定是介於一個可以調整的系統:
1. 一天一則最值得看的訊息
2. 一天十則最值得看的列表
3. 一週10則最值得看的清單
4. 一週只看一則有甚麼最值得看的
除了讓人可以選擇訊息密度外, 且有三個選項:
1. 全部相同的觀點
2. 依你閱讀習慣的觀點
3. 更有價值的觀點
這系統自然是希望完成第三點, 但也是最困難的點, 因為這個 "價值" 有時是很難定義的, 因為這有時會遷涉到價值觀等的主觀判斷, 但也不是說完全做不到, 例如可以用 "你期望的典範 Role Model" 來去趨近 (Approach), 當然現在系統已經一步步完成, 在第二點還在做微調的情型下, 第一點是最簡單可以完成的.
我相信很多人到現在已經看得霧煞煞, 那麼單純的一個 "分享" 數數系統可以變得那麼複雜, 這也是 Data Mining (Big Data?) 困難的地方, 看起來很簡單, 但須要很複雜的流程才能做到, 看起來那麼不可行, 確又可以用 "量" 去產成出有 "質" 的東西.
這也可以證明一個真的可以實用的系統, 在做出之前, 的確可以做出不少有趣的 "副產品", 往往有這副產品的經驗, 才可以讓真正的主產品完善, 尤其是這種大量資料的計算, 就像是我之前有提到, Facelab 的這個 Project, 要做出能夠真的靠臉來判斷人的工具, 真的在實用化之前必然有很多 "副產品", 之中最有名的就是 "Meet the world's Mrs Averages: Scientists blend thousands of faces together to reveal what the typical woman's face looks like in 41 different countries from around the globe" (41 個不同國家女性的典型長相) 這個成果, 所以這篇文章用的圖是這個 Lab 10 個成員的 "Average Face".
當然有 Average, 也要去講 "Unique", 所以原本這網址要改名的, 但最後還是延用 que.tw, 只是取的不是 Unique, 而是 Quest, 因此也真的真除 "林客傳說(探索)" 這計劃名.
寫到這邊, 又忘了給大家網址: http://link.que.tw/new.php, Have Fun!!!
訂閱:
張貼留言 (Atom)
熱門文章
-
在開始寫這篇之前, 先弄個小 box 讓大家回顧之前有關 網站完全評點 (原SEO鑑價系統) 的文章: 對黑帽 SEO 的回應 (SEO 鑑價系統的初探 I) 內容關鍵字的數量與比例 (SEO 鑑價系統的初探 II) 你找的 SEO 公司真的有成效嗎? (SEO 鑑價...
-
昨天在臉書的塗鴉牆朋友分享了一個 王美恩 的" 狀態更新 ": 今天在外面餐廳吃飯,旁邊一桌坐了五六位穿著制服的廚師在吃飯。 老大開講:「我跟你們說,要看警察打人就要看三立,要看學生丟石頭警察受傷就要看中天。」 小廚師問:「大哥,你都不看T...
-
當我們做出一個系統, 最希望知道的是有沒有檢定判讀的能力, 不然價值與意義就會少很多, 而在做未來國會的時候, 很多人問我, 網路聲量是否能夠轉化成得票數? 事實上我也是很好奇.... 首先一開始, 就直接算出得票數與網路聲量的相關性 (相關係數), 得出來的答案是: ...
-
剛不小心去按 plurk, 發現跑出一段 error code: Traceback (most recent call last): File "/home/plurk/plurk/production/releases/20090104210908/ext/part...
-
依 IMDB 超過 1 萬人以上評分的順序 降世神通 1. 9.3 Avatar 降世神通 2. 9.2 Ricky and Moorty 3. 9.1 鋼之鍊金術師 Brotherhood 4. 9.0 進擊的巨人 5. 9.0 獵人 6. 9.0 死亡筆記本 11. 8.8 ...
-
民進黨為了要決定提名,因此辦了民意調查,來決定候選人,而公布高雄市的民調時,嘗試跟 "專頁儀表板" 做了個比較,發現相關性達到 0.99 以上這個令人吃驚的事,但第二天台南的民調跟專頁儀表板的相關性只有 0.03,這數字可以說是完全無關,而 0.99 的相關性...
-
會取名網事是有原因的, 不單純的只是 "網站的事情", 也是因為我習慣用雙關語與諧音來命名的關係, 因此這個 "往事" 也代表來看過去, 從看過去的事, 來做現在的事, 因而決定未來. 因此會有一個很有趣的功能, 也就是我很喜歡的數...
-
很多人以為實況投票只是一個浪費頻寬的工具, 雖然這是真的, 畢竟若只是一張圖, 上面就是幾個數字跳來跳去, 我真的不知道這是為了做甚麼? 況且這些投票, 本來就存在粉絲團本來的結構性偏差, 動員力量的問題, 甚至還有人把 "讚" 的選項做進去, 這不是刻意誤導...
-
我們都知道網路詐騙是一個很嚴重的問題, 不下於假新聞, 雖然這些事都不是在網路上獨特的社會現像, 因為在現實社會這些欺騙的事層出不窮, 但透過網路的高效率散播, 有時比現實社會來得嚴重. 在臉書投廣告, 大部份都是須要透過粉絲團來操作, 若是我們能夠 "定位...
-
在我寫出前言後, 當天晚上就把當時所說的數字的計算中兩個未寫入的就直接加進去後, 演算法就算是定型了, 然後就是未來的幾個部份: 1. 歷史: 當然每一週的變化是要可以記錄, 但是 "追加" 的部份怎記就是一個大問題. 2. Widget: 本來這系統正式要出...

沒有留言:
張貼留言