2014年5月30日 星期五

妳適合那種網路工作者? (彼得塔之鏡/Big Data Mirror)

最幾天戴季全突然又在網路圈引起一個波瀾, 雖然說最後似乎是戴總拒絕了民進黨的邀約, 只是原始的新聞是否只是種風向球呢? 因為當時傳出這新聞時, 網路圈真的是熱熱鬧鬧的討論, 當然有人認為民進黨做了個好的示範, 但也有人認為這是個壞決策, 無論如何現在已經不用討論了.

當然其中有一個有趣的討論, 要怎樣屬性的網路工作人, 才能夠年薪千萬或者是是成為知名被延攬的人呢? 這時候彼得塔之鏡就可以派上用場, 雖然我們沒有拿到戴季全的授權, 所以只能用推測的, 在之前, 我們先就定義出網路工作者的屬性:

1. 網路資本家: 等級最高, 可以指揮寫作家, 左右評論家, 可以決斷資源的使用, 大家都只能聽他的.
2. 網路評論家: 鄙昵其他網路工作者, 評斷別人做錯的事情, 是網路主要的意見領袖.
3. 網路寫作家: 是網路產業的最大貢獻內容者, 努力的寫作賺取微薄的薪水.
4. 網路宅在家: 是網路產業的消費者, 也就是鄉民(?)

不難得知, 戴季全先生應該是網路資本家, 在網路世界擁有很多資源, 不只在網路界是知名人物, 在其他領域更是關係良好, 不知道有誰能夠請戴先生授權給我們 Big Data Mirror, 透過這樣的分析, 讓大家學習如何成為這樣的成功者所須要的屬性與步驟.

在這邊我們來研究這四種網路工作者的人, 會閱讀資訊的屬性差異為何, 就下面我們來定義一些因果關係:

1. 網路資本家: 當然主要閱讀的是像 TechOrange 之類的文章, 也會讀數位時代之類的媒體.
2. 網路評論家: 網路評論家的媒體直覺想到的就是 Circle, 其外還是有一些類似屬性或個人的粉絲團.
3. 網路寫作家: 這個就較多, 包含 Cool3c, 科技新報, 這些是網路寫作者資訊來源或產出的媒體.
4. 網路宅在家: Mobile01, 還有許許多多部落格.

然後我們來做些實驗, 此時我就拿我認識的朋友來測試 (呵呵), 一個是知名的網路酸哥 Ken Hsu, 一個是網路內容產出的佼佼者鄭龜, 可以看得出來說要一個人只擁有一種屬性是很難的, 雖然從下表看得出來他們兩個在寫作家或評論家都有各自的擅長與占比, 甚至這四種屬性或多或少也有差異, 這時大家可以去看看自己這四種屬性是怎樣分布的.
























大家可以到 http://fans.que.tw/2/internet/501019727 來看自己與跟我比較.

會做這例子是因為有個朋友說對網路工作已經越來越沒有感覺了, 雖然用這例子說要去激勵人似乎也沒甚麼著力點, 而原本我是想透過 電影, 美食, ACG 等等跟這些較有消費意義的做例子, 但還有很多後面的系統沒有完成, 所以就不會想拿出來推銷.

這系統須要大家的回饋, 不只是做測試而已, 因為在這邊演算法須要調整的地方還很多, 謝謝大家.

彼得塔之鏡 (Big Data Mirror)

彼得塔之鏡是一個很特別的計劃, 甚至是在某方面是獨立的計劃, 這是一個透過一種演算法, 大量降冪解空間 (可能性/計算量), 說成白話文, 就是 Big Data 真正的應用與實作, 尤其是在很低的運算成本下, 來達到很高的準確度.

而這個演算法, 是非常有趣的一個發想與經驗, 我在這邊是命名為 "工頭監演算法", 因為一開始是工頭監認真開玩笑的把白色正義粉絲團拿出來說: "這是壞朋友刪除系統", 此時受到很多人附和, 我也覺得這是相當有趣且有用的觀點, 因此就開始發想:
1. 粉絲團是一個很好的屬性判斷系統, 不只可以當作結果呈現, 也可以當作因子分析
2. 一個人會加入的粉絲團數相當有限, 若是從朋友來看的話就會資料越多, 越準確
3. 只要人工定義一些粉絲團的屬性, 就能夠透過朋友來展開這個使用者的屬性
當然這邊還是有 "近朱者赤, 近貘者黑" (越講越無聊) 的假設, 也就是說, 一個人會受其朋友所提供的資訊影響, 也會因為這樣選擇資訊, 挑選朋友, 所以 "要了解一個人, 就要看他的朋友", 我想這應該是不難想像的.

只是很多人應該會問, 那這系統是用來做甚麼呢? 當然不是用來刪好友的, 最重要的有幾個方向:

1. 若這些粉絲團是一種產品相關, 例如手機, 音響, 透過這樣的機制, 可以找到那些人對這產品越了解, 甚至是越有勸敗力, 因為他是這些產品的訊息中心.

2. 若這些是種跟工作有關的能力, 就可以算出這個人對這專長投入的程度, 例如用 PHP, Big Data 的粉絲團, 就可以篩出有這種能力, 或透過他可以尋找到這種能力的人.

3. 若這些粉絲團是種個性或是特殊興趣, 就可以變成做為性格分析的系統, 就會像透過分析出來的心理測驗結果, 例如你是不是文藝青年那樣, 可以從文青會加入的粉絲團做分析.

4. 若粉絲團屬性是種議題, 就可以看得出來這個人的想法, 即使他沒有真的說出來, 但他朋友就會幫他說, 例如他是否贊成廢除死刑或反對廢除死刑, 這樣就是個表態系統.

5. 若這粉絲團是種興趣, 有時就可以當作交友系統, 篩選出跟你有類似興趣的人, 這樣會比很多交友系統來得準.

當然這些都是可以是種單一性向的計算與分析, 有時可以做複合性的比較:

6. 若粉絲團是指向某些候選人, 就變成知道一個人對於選舉時支持的傾向, 或者是動員的對象, 例如就可以知道一個人是支持柯文哲還是連勝文, 或者是馮光遠之類.

7. 若粉絲團是種有差異的屬性, 就可以變成成份分析機, 例如可以知道這個人對網路的認知差異, 例如是主張創業, 或文藝, 或者是評論等等.

8. 若這些粉絲團是競業的產品, 你可以透過這個幫使用者做建議與篩選, 說不定可以做出最好的消費決策避免錯誤消費.

事實上能夠派上用場的機會真的很多, 取決於你如何定義粉絲團, 找到其因子, 然後去總合或去比較, 或者是去排序, 或者是用來篩選, 而這系統的準確性在於如何精確的找到粉絲團去計算, 這才是最困難的工人智慧, 然後就可以交給電腦系統去算就不是問題了.

這系統的演算法已經改了大改兩個版本, 小改十幾個版本, 說不定有空又會再大改一次新的版本及再幾次的調校, 畢竟這些系統在於真的有實用性, 若是無法實用, 就失去意義了, 接下來會分幾篇文章介紹其功能, 到現在這系統已經寫快一個月了, 也做了不少測試與改進, 而在未來真的要實用或商業應用, 看起來還有一段路要走.

最後往往寫完忘了附網址: http://fans.que.tw/

熱門文章