2014年5月30日 星期五

彼得塔之鏡 (Big Data Mirror)

彼得塔之鏡是一個很特別的計劃, 甚至是在某方面是獨立的計劃, 這是一個透過一種演算法, 大量降冪解空間 (可能性/計算量), 說成白話文, 就是 Big Data 真正的應用與實作, 尤其是在很低的運算成本下, 來達到很高的準確度.

而這個演算法, 是非常有趣的一個發想與經驗, 我在這邊是命名為 "工頭監演算法", 因為一開始是工頭監認真開玩笑的把白色正義粉絲團拿出來說: "這是壞朋友刪除系統", 此時受到很多人附和, 我也覺得這是相當有趣且有用的觀點, 因此就開始發想:
1. 粉絲團是一個很好的屬性判斷系統, 不只可以當作結果呈現, 也可以當作因子分析
2. 一個人會加入的粉絲團數相當有限, 若是從朋友來看的話就會資料越多, 越準確
3. 只要人工定義一些粉絲團的屬性, 就能夠透過朋友來展開這個使用者的屬性
當然這邊還是有 "近朱者赤, 近貘者黑" (越講越無聊) 的假設, 也就是說, 一個人會受其朋友所提供的資訊影響, 也會因為這樣選擇資訊, 挑選朋友, 所以 "要了解一個人, 就要看他的朋友", 我想這應該是不難想像的.

只是很多人應該會問, 那這系統是用來做甚麼呢? 當然不是用來刪好友的, 最重要的有幾個方向:

1. 若這些粉絲團是一種產品相關, 例如手機, 音響, 透過這樣的機制, 可以找到那些人對這產品越了解, 甚至是越有勸敗力, 因為他是這些產品的訊息中心.

2. 若這些是種跟工作有關的能力, 就可以算出這個人對這專長投入的程度, 例如用 PHP, Big Data 的粉絲團, 就可以篩出有這種能力, 或透過他可以尋找到這種能力的人.

3. 若這些粉絲團是種個性或是特殊興趣, 就可以變成做為性格分析的系統, 就會像透過分析出來的心理測驗結果, 例如你是不是文藝青年那樣, 可以從文青會加入的粉絲團做分析.

4. 若粉絲團屬性是種議題, 就可以看得出來這個人的想法, 即使他沒有真的說出來, 但他朋友就會幫他說, 例如他是否贊成廢除死刑或反對廢除死刑, 這樣就是個表態系統.

5. 若這粉絲團是種興趣, 有時就可以當作交友系統, 篩選出跟你有類似興趣的人, 這樣會比很多交友系統來得準.

當然這些都是可以是種單一性向的計算與分析, 有時可以做複合性的比較:

6. 若粉絲團是指向某些候選人, 就變成知道一個人對於選舉時支持的傾向, 或者是動員的對象, 例如就可以知道一個人是支持柯文哲還是連勝文, 或者是馮光遠之類.

7. 若粉絲團是種有差異的屬性, 就可以變成成份分析機, 例如可以知道這個人對網路的認知差異, 例如是主張創業, 或文藝, 或者是評論等等.

8. 若這些粉絲團是競業的產品, 你可以透過這個幫使用者做建議與篩選, 說不定可以做出最好的消費決策避免錯誤消費.

事實上能夠派上用場的機會真的很多, 取決於你如何定義粉絲團, 找到其因子, 然後去總合或去比較, 或者是去排序, 或者是用來篩選, 而這系統的準確性在於如何精確的找到粉絲團去計算, 這才是最困難的工人智慧, 然後就可以交給電腦系統去算就不是問題了.

這系統的演算法已經改了大改兩個版本, 小改十幾個版本, 說不定有空又會再大改一次新的版本及再幾次的調校, 畢竟這些系統在於真的有實用性, 若是無法實用, 就失去意義了, 接下來會分幾篇文章介紹其功能, 到現在這系統已經寫快一個月了, 也做了不少測試與改進, 而在未來真的要實用或商業應用, 看起來還有一段路要走.

最後往往寫完忘了附網址: http://fans.que.tw/

沒有留言:

張貼留言

熱門文章