2014年7月31日 星期四

Automate This: 演算法已經統治世界了....

有人說, 雖然最終人類可能無法創造出人工智慧, 但是人工智慧還是會被工人給 "運作" 出來, 這邊的工人指的就是人類文明的結晶, 而這個結晶的實作之一就是 "演算法".

演算法說穿了就是把人從眼睛看到的事物, 透過一種想法或感知以及應證其經驗, 然後做出行為與動作的一連串步驟, 只是一個人能夠做到的, 就是有限的眼睛, 有限的經驗, 有限的判斷, 最後也只是做出有限的行動.

若是把這些有限放到非常大, 甚至速度是非常快, 舉個例子來說, 若是有一個醫生, 他擁有上億個醫治的經驗, 且每秒 10 次的測量出你的心跳, 血小板, 等等數字, 然後做出判斷預測, 隨時且即時的對應其可能性做出診治, 當然這個醫生不可能是人, 而是一套透過許許多多演算法所創造出來的系統, 只要其病症不是罕見或從未見過, 你認為這套系統難道不只會讓病情更快康復, 也會更降低醫生所須要的精力與錯誤率.

而能夠做到這件事的, 雖然靠的是電腦, 但說穿了還是背後的人, 背後的智慧結晶, 就是現在最熱門的 "巨量資料 (Big Data)" 這概念, 這概念實作與實現的基礎, 就是 "演算法", 而演算法就是把人的行為與想法變成一種模型, 然後把這模型透過程式去執行, 而執行的內容就是巨量的量化資料, 所以說透過演算法去延伸人的能力與智慧也不為過.

只是說要完成這樣的事情也不是只有演算法而已, 甚至應該說只是一個環節罷了, 要完成這環節, 至少要三個大環節才能做到:

1. 硬體, 網路與系統: 雖然說演算法最早可以追溯到 1680 年代的加法機, 甚至演算法之母是在 1850 年的 Ada, 但真的實用到廣為應用還是因為整個硬體架構, 包含計算能力, 記憶體, 傳輸資料等等的細部環節慢慢的組合起來變成實用的系統, 演算法才有真正的價值, 這本書也花了不少部份著墨這些技術的成長, 在某種觀點, 這才是決勝點.

2. 程式設計, 資料庫與其系統: 有了硬體與作業系統跟架構, 就要有相對應的軟體去寫作與實作出來, 畢竟這些都是靠人去完成的, 不是只有人能夠看到的硬體才是系統架構與實作, 程式設計才是把演算法實現的最本質的事, 當然要去能夠執行與串連運作, 是須要一個很完善的設記, 資料要儲存要有資料庫及相對應的硬體, 這些若沒去完成是不存在的.

3. 數學與演算法: 雖然說演算法是核心的核心, 若沒有前兩項也是無法有價值的, 但或許是因為前兩項的人才以現在的狀況是較多, 會了解數學與演算法的人較少, 所以其稀少性較高造成水漲船高, 只是這些都是整合的要素之一, 缺一不可, 當然最好是有人能夠對這三個項目都能夠了解, 在目前大家對資料演算法不夠了解下, 才能夠帶領真的完成有實用的系統.

最近有一本書叫 "演算法統治世界", 讓你知道這些過程是甚麼.........

雖然說這本書是完全是以說故事的方式帶出整件事, 但畢竟不是技術書, 所以並沒有讓你深入了解演算法, 無論就技術面或數學面都完全沒有提到, 若你是想說透過這本書知道這前因後果, 甚至知道未來的可能性, 但若知道甚麼是演算法, 是不太可能的.

畢竟在大學講甚麼是演算法, 最常用的教科書是一本超過 1000 頁的 Introduction to Algorithm, 這本書還只是個最基礎不過的介紹 (Introduction), 從入門到能夠實作出來, 進一步做出有用的系統, 不可能是只靠看這本書就完成的, 甚至我更擔心的是看過的人會由一些應用結果來猜測甚麼是演算法, 且跟本是錯誤觀念, 因此請大家千萬不要踏上這錯誤路徑.

但這本書只是為了讓完全不了解演算法的人, 有一個演算法對社會性與商業性影響的了解, 可是千萬不要拿著這本書去要求技術人員, 或以為技術人員就可以做出來, 因為這完全是兩回事, 因為從這本書到最後做出來, 還須要超過幾十本書到幾百本書, 但看完至少你對這議題有基礎的了解.

這本書從金融, 音樂創作與市場, 客服系統, 運動等等, 這些透過各式各樣的演算法去預測, 去創造出更高的價值或改善其準確度, 甚至對政治都能夠預測最後人心的走向, 這些不是天方夜譚, 這些都是實例, 只是這些都須要背後有大量的運算, 其中包含數學與程式設計.

當我們能夠把人的行為步驟寫成程式碼, 把事物給數量化之後, 很多事情不只能夠自動化, 此時效率與效能會比人類強很多, 而這本書就是在寫這幾十年來, 各個領域在這方面的努力與挑戰, 甚至是當時認為是天方夜談的, 現在早就已經有人做過了, 只是這個狂想須要付出很大的努力與代價.

所以我們現在也可以開始對未來做夢, 但更重要的是透過學習與實作, 把這個夢實現, ... 在此之前可以從這本書看看別人是怎麼做夢, 以及將之實現的, 無論你是不是在資訊界, 因為還有很多領域等我們去挑戰, 也因為這樣的開始, 這個世界都在改變.

圖取自: http://www.businessweek.com/articles/2012-09-06/book-review-automate-this-by-christopher-steiner

2014年7月24日 星期四

一個猴硐, 多家表述, 從分享行為來看內容農場

在這邊先說, 內容農場並沒有刻意的價值判斷, 不然就像我最欣賞的內容農場就是 "達達主譯", 但他們真的是以讀者做出發的, 而下面這些, 我不予置評了....

在 7 月 22 日下午 6:35 分時, 武藤在臉書貼出了一篇 "猴硐不是貓天堂 不要在被騙了", 經過了 50 小時, 獲得了 26,878 個分享, 及 27,209 個讚.

在 7 月 23 日 早上 3:55 分時, 東區潔西卡也在 gigacircle 轉貼了 "【踢爆真相】武藤:猴硐不是貓天堂,不要再被騙了", 但加註了自己多的 8 點小常識補充, 過了 40 小時, 獲得了 15,712 個分享, 80,887 個讚.

在 7 月 23 日 下午 1:49 分, 主場新聞用作者自己的名義轉貼了 "台灣猴硐不是貓天堂 不要再被騙了", 31 小時內獲得了 6,730 次分享, 29,646 個讚.

在 7 月 23 日下午 5:38 分, ETToday 東森旅遊雲由記者陳睿中以報導的方式, 轉載了 1/4 左右的文章, 在 28 小時內獲得了 4,766 次分享, 38,690 個讚.

同日 Life.com.tw 也由黛雯發出 "【踢爆真相】武藤:猴硐不是貓天堂,不要再被騙了", 其中也包含了 8 點小常識, 目前也獲得了 2,317  次分享與 8,974 個讚.

這邊可以做個比較, 原作是 26,878 個分享, 及 27,209 個讚, 而其他四篇文章總共有 29,525 次分享, 及 158,197 個讚, 而總分享數雖然只是超過原作一點, 但按讚是原作的 6 倍, ...

就按讚數來看, 依序 GigaCircle, 東新旅遊雲, 主場新聞與 Life.com.tw, 而分享名次是 GigaCircle, 主場新聞, 東森旅遊雲, 跟 Life.com.tw, 其中主場新聞與東森旅遊雲二三名對調, 看得出來主場新聞分享力較強.

為甚麼會有這些差距呢? 或者說這後面有甚麼因素呢? 在這邊做幾個有趣的計算:

1. 第一天的數目占目前數目的比例.
2. 前三天的數目占目前數目的比例.
3. 第七天時前六天各自比例的總合. (Spread Rate 散播率)

當然這幾個連結都是第二天而已, 所以後面兩個數字還沒出來, 但就從這邊來看, 這四個網站的第一天比例依續是: 35.7%, 60.4%, 63.1%, 及 56.6%, 從這邊看得出 GC 的數字是遙遙領先其他三站, 也就是第二天之後還是有散播的持續力, 也造成其總數也是最高的.



我們知道, 雖然說第一天傳播的力道是決勝點, 但一個能夠持續散播的網站才是讓連結有更多的分享與按讚的一個很重要的因素, 因此要看一個網站真的要看這三個分數, 尤其是最後的分數一種檢驗, 只是到第七天已經只能做檢驗而無法再做甚麼操作了.

所以看上圖的 Gigacircle 就可以知道第二天的流量在某方面不遜第一天, 而下圖的主場新聞在第二天流量就已經完全不行了, 而其中有一個很重要的因素可能是評論, 雖然按讚數不多, 但評論保持一定的量所以第二天還是有足夠的散播力.



雖然說最重要的因素也是時間, 因為 GC 算是時間最早的, 加上會員數與流量, 最後分享數超過原作的一半, 按讚數是原作的兩倍.

從林克傳說的 Reach Rate 來看, 主場新聞是最多最快的, 不到兩小時就被收錄, 就分享比例也是如此, 看得出來主場新聞倒是比較受到臉書讀者的歡迎, 但在某方面也是蠻局限的, 相較 GC 的使用者還是少很多.

說了那麼多, 最大的問題是: 到底內容農場對原作是好還是不好, 這篇原作由於不是在外部連結, 影響說不定不大, 至少沒有廣告的問題, 也就不會有收入的問題, 但若這是一個也是有版權的網站的內容, 可以肯定的是原作網站可能只剩四分之一或者更低, 此時問題就很大了.

而在七天之後, 我們來看散播力, 再來檢驗一次各家的會員的屬性對於散播, 分享, 按讚與評論的差距.




2014年7月14日 星期一

那些網站最被台灣網友分享與按讚?

在看排行榜之前, 應該會依幾個角度來看...

1. 媒體的排名, 其中包含傳統媒體在新媒體的成果, 以及純網路新媒體本身.
2. 轉貼站的效應.
3. 個人自媒體的比例.

取樣時間, 上星期, 也就是 7/7 到 7/13 號, 我們來看分享排行榜吧...

分享排行榜:


其中大家最有興趣的媒體排行前五名是: 東森, 自由, 蘋果, 關鍵評論, 巴哈姆特.

而按讚排行榜如下:

而按讚的媒體前五名是: 東森, 自由, 蘋果, 關鍵評論, 天下.

這邊看起來, 前四名是蠻穩定的, 接下來兩個排行榜都能在前 20 名的有天下, 癮科技, 民報, 上下游 這四個媒體.

而轉貼站的排行 Gigacirlce 在分享數第一, 而放泥就可 (onefunnyjoke.com) 第二, 但按讚數剛好相反, 接下來有 van698.com 與 life.com.tw 追在後面, 其他 teepr.com 反而沒有預期的表現, 表示這週成效不彰.

上面的截圖是前 30 名, 而要看前 50 名可以到 http://link.que.tw/facebook_site.php (分享排行榜) 以及 http://link.que.tw/facebook_site.php?type=like (按讚排行榜), 跟評論排行榜 就有前 50 名的資料.

2014年7月11日 星期五

為甚麼那麼多人喜歡戳人?

[副標] 越有爭議或越有人討論的文章, 不只可能越多人分享, 且活得越久... (原本的標題, 但發現太長, 所以就來標題殺人)

[QOTD] 越多評論的往往代表話題性越高, 所以不是那種可以 "射後不理" 的類型, 因此繼續延燒的可能性越高, 而沒有持續的被關注就不會有繼續擴散的可能性了, 所以 "話題性" 可以決定一個連結的生命週期是相當合理的.

在做出臉書排行榜時, 最麻煩的不只是做出來, 雖然這真的很麻煩, 但接下來的問題是要如何呈現, 也就是在資料探勘中的 Data Presentation, 然後才是要發現甚麼事....

這系統既然是須要抓出連結在臉書分享, 按讚, 評論的狀況, 也就是很頻繁的去計算, 所以要看到一則訊息是如何被討論, 如何被分享, 如何被按讚不是問題, 重點是怎麼看, 最直接想到的方法就是依時間去區分, 做出每日, 每週, 每月的排行榜, 然後可以的話可以針對來源出處做分類, 或者議題做分類然後獲得不同的觀點, 甚只也包含分類內的比較與排行, 這都是放在 Todo 的.

當然除了做比較外, 去 Insight 透視一則連結的臉書行為特徵, 然後做出判斷, 預測, 做為下次操作的參考也是很重要的事, 而一則的連結一定有其特徵值:

1. 按讚分享評論的總數
2. 上面三個數字的曲線與趨勢
3. 按讚/分享比
4. 評論/分享比
5. 衰減程度
6. 目前熱度與週期位置
7. ..... 好多好多做不完.....

而直覺上在還沒有畫線時我最有興趣的事是 "按讚/分享" 比, 當然後面 5, 6 對系統對了解狀況更重要, 但若能透過一兩個數字的指數化分析能夠獲得甚麼結論, 是最直接的, 只是看了許久, 也看不出個所以然 (雖然是有, 但不明鮮, 以後再證明), 所以要能夠獲得甚麼想法, 最簡單的就是 Visualization (視覺化) 吧.

一做出來我震驚了 (來個震驚體), 原來這趨勢的重點不是 "按讚分享比", 而是 "評論分享比", 也就是要知道一個訊息未來還有沒有延燒的可能性, 主要是在大家最乎略的 "評論", 而不是大家熟知的 "按讚" 與 "分享".

當然這個不難想像, 越多評論的往往代表話題性越高, 所以不是那種可以 "射後不理" 的類型, 因此繼續延燒的可能性越高, 而沒有持續的被關注就不會有繼續擴散的可能性了, 所以 "話題性" 可以決定一個連結的生命週期是相當合理的.

只是到底甚麼樣的文章可以有很多討論呢? 主要分成幾點:

1. 非常偏頗的文章 (很有爭議的文章) : 當然這會造成一群人相當支持, 當然也會有人相當反對, 此時衝突就出來了.

2. 明顯錯誤的文章 (引戰文): 不是說出真正的事實, 而是說假話, 當然問題更多, 所以引戰文常常評論也相當高.

3. 罵人或想獲得別人認同的文章: 這當然是很多人最喜歡用的暗黑心法, 當然這評論包含附和或反對的討論與評論.

4. 挖掘問題或提出問題的文章: 要寫出這種文章是相當困難的, 甚至要花很多心力, 當然若是真的抓到重點, 這力量絕不輸給前三種文章, 只是這種文章是可遇不可求, 以及成本相當高, 所以很少出現.

我們用下面四張圖來做例子好了:





當然大家可以直接去新做出來的臉書排行榜來看, 而上面四張圖, 其中黃色的評論, 若黃色線比紅色線 (分享) 低, 這個線圖很快就會消失, 相對的黃色線比紅色線高時 (數目多), 衰減程度就不會那麼快.

所以大家可以放下粉絲數, 甚至可以放下按讚數, 說不定最後更重要的是評論數, 由其是接下來的轉換率, 包含 CTR 等 Transfer rate 說不定最後的答案是在這邊.

2014年7月9日 星期三

該禁的不是 Uber, 而是計程車

記得有人曾經說過一句話, 若是把台北把計程車給封印起來, 台北的交通會好上一倍, 因為計程車有超過一半的時間不是在讓人到達目的地, 而是浪費汽油資源, 浪費司機時間, 浪費道路流量.

計程車為甚麼要這麼浪費, 這樣的目的只是讓一些人, 透過隨招即有來節省一點時間, 雖然說很多狀況與很多地方都是招不到, 所以也節省不到時間, 但這種情形就有點感覺是習慣使然, 這種習慣帶來這樣的市場, 帶來這樣的狀況.

我們不須要用高道德標準來看人須不須要計程車, 但如何在改善交通, 節省資源, 甚至更可以節省時間, 創造價值的角度來看, 我們是否真的可以建立一套系統能夠實現這願望.

我一直認為, 政府是不須要 "創造" 甚麼經濟成長, 這應該由人民來主導, 而政府須要的是創造環境來讓經濟更順暢就夠了, 而其中最重要的一點就是: "交通".

在十幾年前因為參與一些 ITS (Intelligent Transport System) 的經驗, 也一直在想說透過資訊系統, 如何來輔助這樣的系統的建立, 能夠讓交通運輸降低資源須求但提高使用的情型, 以現在的角度來看, 就是如何利用 Big Data 來促成 "Smart City/智慧城市" 的可能性.

事實上我們不該只是討論 Uber 的合法性, 創新與創業的問題, 也不只只討論計程車生計等等的問題, 而是更應該去思考, 我們如何去創造出我們要的社會, 我們要的城市, 而我們知道影響到我們生活與情續最大的一個關鍵也是 "交通".

要設計出一套系統能夠讓接送過程, 與等待時間所造成的浪費, 甚至也能降低乘客的等待時間, 最重要的關鍵就是 "能夠預測出乘客的須求, 並規劃出最省資源的可能性", 這樣就可以做到了, 這句話聽起來很簡單, 但真的要實作是沒那麼簡單, 因為能夠預測未來是最困難的.

但話說那麼困難, 事實上每一個計程車司機都有一個能夠預測的頭腦, 有時他們的經驗與準確度是可以嚇死人的, 所以聽起來也不是完全做不到, 只是這種經驗與預測能不能被記錄, 被擴大, 被實用而已.

在 10 年之前就有推出 Smart City 的計劃, 但這些計劃有很多前置動作是沒有完成的, 也就是那時候得資訊系統, 要知道人流與車流的成本太高了, 所以在資料不足的情型下準確度當然不足, 所以效用與實用就大打折扣, 而現在的世界已經不一樣了, 要精確的知道人流與車流已經沒有那麼困難, 甚至要進一步的做出預測或輔助系統跟以前的環境與條件好很多了.

甚至下一步的建立交通的共享經濟, 公用腳踏車, 公用機車或汽車, 甚至是 "共享交通工具" 等等的概念也不是沒有人想過, 甚至有很多人在做或想做, 只是這部份說要做出實用須要很大的量變到質變, 就像是 U-Bike 之前的公共腳踏車不是沒有推動過, 但在之前沒有足夠的資訊系統讓大家租借與使用方便之前, 以及付款機制更便利之前, 甚至最重要的是足夠的 "量" 之前, 已經有太多次失敗, 但這樣不代表這概念不會成功, 而現在不是就成功了嗎?

所以真的要建立智慧交通, 智慧城市也不是一蹴可及的, 但也不是做不到, 甚至我認為台灣或台北市有很多機會點都比很多國家城市有更好的基礎, 無論是網路使用率或心態等等, 雖然不會是最有利, 但也至於最差, 再加上台灣工程師的能力, 與台灣的產業, 倒是很有機會去打造出真正的 Smart City.

只是依台灣現在的政商模式, 更容易發生就像我當初為甚麼離開當時 ITS 計劃的原因, 也包含我們已經很熟知的 "遠通電收" 事件, 反而浪費更多的資源去打造出這樣的系統, 或者是明明有機會做得更好卻沒有去做, 更像是現在在討論 Uber 與計程車的問題......

所以我們該禁的不是 Uber, 而是計程車, 但也不是該禁的是計程車, 而是我們要去讓像計程車這樣的交通系統更進化, 讓這種花太多人力資源與能源, 占據道路面積吞吐量的計程車, 在很多地方很多角落可以升級成 "客製化共用汽車系統", 讓原本傳統計程車系統去轉型, 而不是透過 "法律去禁止", 就像是我們在面對 Uber 一樣.

接下來我們該怎做, 事實上我也知道台灣有不少人已經在規劃與實驗, 再加上國外有更多的經驗與實例, 這些技術與資源也都慢慢解決與成熟, 真正的問題不是怎做而已, 而是我們的心態, 更包含我們對社會的期許, 以及接下來大家所須要的努力, 以及 Big Data!!!!!

--------------------------------

這邊舉個已經實作的例子, 就像是 Google Now 一樣, 可以從 Android 手機來知道一個人移動改變, 就可以輕易判斷出在今年五月一日上線的 Parking Location (停車地點).

透過這樣的機制, 可以發展出即時人流與車流的交通狀況與須求, 甚至可以發展成預測出交通運輸的須求的系統, 若是加以結合日曆或行事曆系統, 就可以知道活動與人潮的須求, 提高準確度, 做出一套交通預測與規劃系統.

甚至政府該做只是這套系統後, 提供資訊給計程車司機, 誰說要達到目標是很困難的?

圖例來源:

http://www.ehi.eu/news-item/commission-launches-innovation-partnership-smart-cities-and-communities

http://www.digitaltrends.com/mobile/google-now-soon-reminding-parked/#!ba0Qwa

2014年7月8日 星期二

從網路行為層級來看網路民意趨探...

要去看一個議題的熱度, 可以去看這議題被多少新聞提及, 包含字數, 版面, 或者是電視的秒數等等的計算, 可以看到這議題的熱度, 但這頂多是大眾傳播媒體的觀點, 而我們知道現在大眾媒體已經很容易被操控, 有時報導的不只有很多置入, 更有很多炒作, 雖然不否認這些都會影響到民眾, 但這些議題在這些大眾媒體的熱門真的不能等於民眾關心的.

而在現在, 社群網站在社會中, 已經是訊息傳遞的中心了, 所以只要透過社群網站的分享狀況, 就可以看得出來一則訊息或一個議題的覆蓋率, 即使只是一則新聞, 或者是跟本被大眾媒體封鎖的小眾新聞, 透過社群網站的散播效用說不定更大, 所以透過了解社群網站對訊息與議題的覆蓋率 (或是觸及數), 更能夠精確知道民眾在關心的事.

不只如此, 透過進一步知道其真實的分享數目, 按讚數跟評論數之後, 想要真確的知道不同層級的民意也是不難做到的事, 因為閱讀只是一種角度, 而要真確的探知到完整的民意, 要從各種角度去思維:

1. 閱讀
2. 按讚
3. 搜尋
4. 留言
5. 分享
6. 發表
7. 行動

而林克傳說一開始是以 "覆蓋率" 為出發, 就是一則訊息在被分享之後, 能夠在一定時間內, 被多少人看到為基準, 也就是上面所寫的閱讀, 當然這邊能看到, 指的是有機會出現在多少人的動態消息, 而最後這些使用者有沒有打開, 或者是有看沒有到, 就不是林克傳說能夠解決的事, 但至少這是很接近閱讀的行為.

接下來更包含按讚, 留言, 分享各種層級的網路行為, 其中林克傳說第一階段解決了閱讀, 而在 Google/Bing Search Trend 中, 我們可以知道搜尋的行為, 再加上之前 SEO.datamining.tw 網點跟曾經做過的 "部落格好好讀", 從這可以看到大家的發表的方向, 而按讚, 分享與留言就靠這次去補足了.

之前的經驗, 發現即使是網路上的行為, 因為行為的動機與動力須求不同, 各個層面的表現結果也不同, 所以想要只透過一個層面去假設這是網路民意是很危險, 偏差是相當大的, 透過各個層面的切割剖析, 就會比較接近網路上的整體想法,....

雖然話說真的透過這些系統, 最後有極精確的知道網路上大家的想法, 但目前台灣社會還是有一群人不用網路的, 更且這群不用網路的人不是跟網路使用者是 "獨立分布", 也就是說只是抽樣的不同的隨機事件, 而是在思維邏輯與行為上本質有很大的差異, 甚至可以說是在某些民意是完全相反的, 這才是只有看網路民意最大的問題.

當然隨著時代的改變, 網路使用者 (網民) 從原本總人口的 10%, 20%, 40%, 到現在已經突破 50% 了, 甚至可以說已經有一半以上的人口脫離被大眾媒體僵化的思維所掌控, 也就是說在某種角度是從愚民的 "資訊被推送接受者", 到多少有能力去選擇資訊的人, 即使這在某些具有 "高道德意識" 的新聞從業人員, 會認為這樣的社會已經不再有 "美感" 而更低落, 也失去很多的一致性與道德性, 但在某方面, 這樣的轉變是讓更多人具有獨立人格也是好事, 不再只是被操控的受眾.

的確網路的社群媒體傳播, 會造成有些人已經開始有自己的想法, 雖然說這種狀況只是讓所謂的 "愚民" 社會變成到被自我與朋友限制的 "集體迷思", 甚至有些選擇不見得都是好的, 但身為一個人在這價值完成就應該去學習如何 "選擇", 而不是單純的被選擇.

所以當妳對一則訊息按下 "讚", 做出 "分享", 以及提出 "評論", 妳應該知道這些行為, 已經不只是在選擇自我成長的方向, 更是在一點點的在改變這社會, 難道不應該對此訊息多一點思考, 而不該只是個按讚的反射動作機器人, 因為當妳按下讚, 這訊息就會多一點被認同, 當妳按下分享, 這訊息就會更多人知道, 當妳作出評論, 這訊息就會改變妳與整個社會, 所以我們更應該的積極而認真的面對這些訊息有所行為, 透過這些行為來超脫這行為, 影響到網路與非網路, 讓我們對社會做出更多有意義的事.

圖: on his face is a map of the world

2014年7月1日 星期二

從兩個台灣工程師值不值八萬來看台灣老版的迷思

最近很火紅的一篇文章就是: "為什麼我甘願花 8 萬僱用法國工程師,也不給兩個台灣年輕人機會?", 這篇文章點出很多問題, 其中是下面三項是重點:

1. 全球性市場後的台灣競爭力
2. 英文的重要性
3. 台灣正規資訊教育的問題

這三個問題應該沒有人否認這問題不是問題, 甚至應該是問題相當嚴重.

只是第一個問題我比較少接觸, 我目前沒有真正跟印度越南人共事的經驗, 更不要說是競爭的經驗, 所以我對原作的話無法反駁.

而第二個問題雖然是問題, 只是我身邊的人英文都很好, 不乏在國外求學或工作經驗的人, 只是我也看到許多人 "怕英文" 這件事我也多少有點憂心, 這問題更出現在一些私立大學身上, 因為同儕與教學環境的關係, 英文的學習常會因此成長緩慢, 雖然這些狀況比較少在國立研究生身上出現, 但因為現在研究生人數越來越多, 所以整體平均程度多少會被往下拉一點是真的, 所以我是相當認同原作的話.

第三點更不用說了, 台灣的正規資訊教育真的有問題, 雖然這一半的問題不是在資訊教育, 而是在教育體制的本身, 學生不知為何而學這問題, 當沒有了學習動機, 學習效果就大打折扣, 這邊的前一個問題正是台灣學生缺乏實作精神所造成, 也包含了對社會的參與及獨立學習的能力等等因素.

但事實上我們也知道在資訊界能夠表現不錯的, 真的資訊科班出身只有一半, 其他非本科系出身的都靠有學習動機與自學能力的人補上, 但其中更有一個題目是透過這樣的學習, 尤其有些人更唸完大部份大學與研究所須要的課程, 此時若把這種人直接劃分為沒有經過資訊專業訓練的觀點來決定能力, 這樣就過於文憑主義了.

這篇文章點出的這三點整體而言都是問題, 但真正的問題不是這個阿, 真正的問題是:

為甚麼台灣老版只願意請四萬塊薪水的台灣工程師, 然後去說兩個四萬塊台灣工程師比不過八萬元的外國工程師

這個結論從上面三點也跳太快了, 因為上面這三點真的存在, 也真的是問題, 但會導致這問題的原因是:

1. 為甚麼老版只願意給台灣工程師四萬元
2. 為甚麼台灣老版願意給國外工程師八萬元

這兩個問題可以延伸或來源自下面幾個問題:

3. 老版真的有能力衡量工程師價值嗎?
4. 老版真的有管道找到夠格的工程師嗎?
5. 台灣的老版真的有魅力吸引到不錯的工程師嗎?

就文章來看, 作者應該有能力判斷工程師的價值, 只是接下來的管道與魅力就是很大的問題, 因為要有管道與魅力吸引到夠格的工程師不只取決於領導者而已, 還包含同儕與產品等等因素, 很明顯的這家公司的產品原創性不足, 公司名聲也不夠, 然後包含老版或 IT 領導者及其部屬在工程師專業社群也沒有足夠的貢獻與知名度, 因此想要用很便宜的撿到不錯的工程師真的是有點緣木求魚.

在我接觸到有不錯工程師的公司很多, 例如 KKBox, Armorize 等公司的工程師素質都很高, 很不幸的他們都不是四萬元請得起的, 甚至是超過八萬十萬的, 因此我不懷疑很多台灣公司的老版跟本是標準的 "想要用香蕉來請獅子, 然後抱怨獅子都不理他", 跟本不了解這樣的薪資, 這樣的環境真的請得起好的員工嗎?

當然這問題不是出在這篇文章與這間公司與作者, 真正的問題是台灣整個就業環境, 其中最大的問題就是台灣的老版已經把薪資設定成如此低了, 也就是說現在台灣薪資水平已經低到這樣, 整個社會已經在自食其果了, 老版不願意花更多的錢找出更有能力做事的人, 員工發現怎做事也無法獲得回報, 台灣的產業就進入這樣的循環.

所以這間公司只是在這樣的循環中的一間公司, 無論是身受其害還是推波助瀾, 因此我們不該對作者有太多的苛責.

但我已經很肯定這家公司是不會請我的, 依照他們這樣的觀點, 他們只願意出我現在薪水的 1/4 不到而已, 很可惜我不是猴子, 雖然我也不是獅子, 因為真正的獅子的薪水比我高好幾倍, 說穿了我只是一隻貘.......

熱門文章