2011年11月25日 星期五

最重要但也最沒用的 SEO 心法

誠實說心法跟方法有甚麼不一樣, 我也不知道, 但不小心就下這個標了.....

做 SEO 的公司真的很多, 事實上說會做 SEO 的人更多, 只是我也都知道, 這邊可能有 90% 的人都是學了一招半式, 就自稱大師, 但這也沒甚麼不對, 因為大師本來就是用喊的, 每一個人的標準都不同, 對我而言, 每當學了一些新的想法與作法, 總是發現還有很多東西要去完成與實作, 而我實際上做出來的不到我想的 20%, 所以可能永遠只能當個初學者.

身為一個初學者, 就要努力的去唸書, 看網站, 實作與檢驗, 畢竟 SEO 最有趣的地方是會隨著搜尋引擎與使用者的變化而變化, 雖然我因此還去唸個圖書館碩士 (只是後來沒唸完), 目的就是要了解人在搜尋知識的思維, 這部份倒是千百年不變的, 而 SEO 的書真的很多, 直接冠上 SEO 的英文書就有二三十本, 而我們知道不可能只唸這些, 還有很多 Marketing, Optimization, Webmaster, Web Analysis 這些也都不能不會, ... 嗯, 離題了, 我們來講這個 "最重要但也最沒用的 SEO 心法" 吧.

為甚麼會寫這篇, 也是因為有人引了一篇文章, 說 Google "從未" 用過 Metadata 的 Keywords 來作判斷, 事實上我不確定為甚麼會這樣, 但事實上大家都知道 Google 是從 Pagerank 起家, 而也從來沒說過他們做的是 Content Analysis 內容分析, 更不用說的是去使用 Metadata, 當然以資訊學的角度, Pagerank 這種以 Reference 的行為也是 "Meta Data", 只是我想到我在 SEO 公司講課時, 我都說: "我做的網站從來沒有去設甚麼 Metadata Keywords", 但我不是說這個不重要, 而是排在很後面, 所以我當時寫了一些次序:

1. 網域名 Domain Name: 但不太可能為了 SEO 去修改與延伸 Domain Name.

2. URL: 除了 Domain Name 外, 檔案名, 目錄名是第二個重點, 而自從 Wiki 事件後, 已經沒有人不注重這塊了.

3. 標題 Title: 這點是最重要, 但也是可以做最最基礎的檢驗, 因為連 Webmaster Tools 都會跟你講你做錯了 (重覆標題, 無標題...), 若你這點都沒做到, 表示有太多基本功沒做好.

4. Head 的 Tag: 在網頁是用 Title, 在內文是用 Head, 而現在有太多人喜歡用 div 來解決一切, 但 Head 不是用來控制大小而已, 而是要講述內文的重點.

5. 其他 Logical Tag: 例如該是用列表時要用 List, 在早期我還會鼓勵下 <em>.

6. Alt, Desc 等符合 "無障礙" 的 Tag: 畢竟搜尋引擎就不是人, 本來就須要一些內容標籤來輔助.

......

N. 關鍵字密度 Keyword Density: 通常重點的名詞一定會重覆, 所以關鍵字密度是很重要的.

.......

M+N. Meta Data: 有很多 Meta Data 可以寫, 但在某方面等同內文, 只是一個是真正的 Content, 只是可以不用人語方式的去描術.

所以 Metadata 到底重不重要, 當然不能忽略, 至少我把他放在 N+M 點, 所以若是前面幾點都做到, 當然也是該去注意, 因為在我觀點, 這也是基本功, 雖然前面還有 N+M-1 點的基本功比他更重要, 也更要去做, 但花時間在這上面, 有點本末倒置了, 其中 N 大概是落在 15~25 之間, N+M 大概是接近 50 了吧.

那甚麼是本呢? 在 N+M-1 點中, 有 30% 的重點是 UEO, UX 等跟 UI 相關的事, 另外還有 50% 就是 "內容/Content", 也就是簡而言之: "內容是王道", 這句話我覺得我都可以設成 Hotkey 直接打算了.

最近在了解與實驗 ("操作") Google Plus 時, 又讓我更再次體驗到 "內容是王道", 因為內容的寫作是最重要, 所以認真的寫是絕對沒有問題的, 但也不是說沒有 "技巧", 其中有很多包含去了解對象, 了解使用者須求, 了解如何觸發讀者的感覺, 加上編排, 等等, 都是以內容做觸發的, 甚至說, 若沒有內容, 如何去做 UX/UEO (使用者經驗優化), 相較於內容, 很多都是非常非常枝微末節的事, 這真的是無話可說.

G+專頁Top100 來看, 當看到丁丁飆英文沒甚麼人訂閱時, 我覺得很可惜, 覺得應該要來好好的推薦, 當然就內容是沒甚麼問題, 但問題是在於推薦文的寫作與曝光, 雖然就這張圖來看, 的確是很有效果, 但事實上更強的是 Taipei GTUG 的一篇文章, 被瘋狂轉貼, 即使在沒有考量到使用者, 對象, 編排, 等等太多的技巧, 一個有趣的內容 (雖然那篇是說 Google 的 Doodle 可以玩), 其效力就是在於好的內容.

但如何寫出好的內容, 我以前都說這個要去找老貓或作文老師, 但就技術面而言, 就是 "越快寫, 寫越多, 越創新" 這三點, 當然創新這個是很難去想, 而越快寫則是新聞類型的平台才能做到, 而我們能做的就是 "寫越多".

我也強調要常看 Weblog Analytics 與 Webmaster Tools 去了解使用者須求, 但讀者的取向是很難抓的, 甚至最難抓的是 "傳教士" (這個以後可以寫一篇文章來討論這點), 相對的, 只要認真寫, 努力的寫, 總是寫 10 篇就有一篇會受歡迎, 若不行, 就寫 20 篇, 還不夠的話就寫到 30 篇或 50 篇, 一直這樣寫, 一定會抓到內容方向的感覺, 只是這前提就是 "努力的寫".

以技術面來看, 如何知道你寫多少呢? 最簡單的就是去 Google 下 site: 這指令, 例如說想要知道這個部落格有多少內容, 就按 "site:geneoralspeaking.blogspot.com", 但因為每次或多或少不一樣, 應該可以看到 300~400 這個數目, 就是你創造出來的內容.

雖然說寫文章是最基礎增加內容的方式, 但做網站不能只靠內容, 也要靠功能面的, 例如做出一個服務, 很有可能就可以產出上萬或數十萬的網站, 像我很喜歡做系統去分析網路的事情, 所以我現在已經有 3 個超過十萬筆資料的網站, 還有另外 5 個也超過一萬筆, 其他小網站也很多, 這就是 SEO 的優勢, 因為我不是個很會寫文章的人, 做網站還差強人意, 所以我只好努力朝這方向去做.

Wait, 但應該有人發現一件很重要的事, 原本引用的文章講的事是: Backlink (反向連結) 不是嗎? 怎會變成老生常談的 "內容是王道" 呢?

嗯, 我在寫這篇時, 也做了一個 Google Docs, 我命名為 SEO Weapon Checklist, 也就是說把我可以用的幾個網站或部落格, 其 Site 的數目做了一個整理 (雖然這些都在部落格觀察可以做到), 因為當你的網頁越多, 越多不同的網站, 若其 PR 值也越高, 代表你的 SEO 武器 (Backlink) 也越強大, 也就是說, 現在最實際的 SEO 方法是連結, 且是好的連結, 白的連結 (很多人會做黑的), 但連結的成本與價值不是沒有的, 就是在於你做出來的網站與內容阿.

若沒有的話, 只好看人臉色, 用交換的, 用買的, 但最便宜與最貴的, 就還是自己做, 甚至有時候都可以說, SEO 白的與黑的差別是在, 你花多少成本在這邊, 因為有太多黑的, 不去做內容, 甚至連結都是用 "Spam" 的, 用 "Linkfarm", 做一些寄生與討人厭的事, 所以當我看到有很多人/公司, 當沒有內容卻有很多連結或粉絲數, 我只能搖頭....

寫到這邊, 我才發現原來我是在擁兵自重阿... 哈哈哈~~~~

2011年11月18日 星期五

身份的傲慢, 誰尊重誰?

在現在許多大學生都不知道的 20 年前, 我們是沒有大學法的, 不要說是大學學生只能聽從 "有三種人是沒有自由" 的說法, 大學教職員也受制於教育部, 而在我們那一年代, 網路還不是很興盛的時候, 站出來說話的成本很高, 不是要貼大字報, 就是要發傳單, 但也因為資訊本來就不夠充足的那個時代, 大字報是學生當時發聲最主要的管道.

當然 20 年前, 許多教授是很保守的, 雖然現在也沒開明到那邊, 嘴邊最常講的就是 "尊師重道", 最強調的就是 "君君, 臣臣, 父父, 子子" 的這樣的 "道德", 這個聽起來非常合理, 說穿了就是: "有些人是可以管人的, 有些人就是該被人管的" 階級意識, 雖然校刊是站在學生這邊的, 學校還是有太多的管道去 "傳遞" 這樣的概念, 而其中在交大那時候的圖書館館長, 更是透過許多方式寫了不少論述, 而學生只好用大字報回應.

其中, 我最有印像的是有一個學長貼了一張海報, 寫了一篇看起來是同意館長的說法, 但把每一個 "尊師重道" 浮貼, 下面打開來看是 "聞道有先後, 術業有專攻", 事實上師不代表道, 尊不代表重.

只是這個 "尊重" 這句話, 理論上應該是在對應人與人的平等關係, 但在上位的人, 卻是把 "尊重" 當成 "畫分階級" 的手段, 用 "師長", "長輩", 等等去劃分既有利益, 也就是說, 在被分割在下面的人, 請乖乖的把利益留給我, 因為我是該被 "尊重" 的!

就像是提出 "團結" 這口號的人, 從來不會是因為團結, 而我放下成見認同你, 而是請你乖乖的站在我這邊聽從我的話; "尊重" 也是一樣, 不是我因為發現你的須求而幫助你, 而是請你了解我的須求幫助我, 我這樣說還算 "鄉愿", 因為真正說出 "尊重" 這兩個字的人心裏的 O.S. 應該是 "你這下等人還不聽我的話", 但何謂上等人何謂次等人, 簡而言之就是他的身份就代表上流階級, 你就是該被踐踏也無所謂的人.

當一個想要緊握著因為 "社會階級", "身份地位" 等等的假像獲得的優勢與利益的時候, 無論這取得是對與錯, 能夠放話的大概就是 "尊重", 換言之就是再次證明他的 "優越感", 與 "威權", 從來不會因為有既得利益者對弱勢族群放 "尊重", 因為這個詞叫做 "體恤/憐憫", 也就是說 "你這賤民還不因為這樣的施捨來感激我的大恩大德", 不這樣說就不是上位者了, 更失他的 "身份" 了.

事實上真正了人之間的關係, 不會因為身份地位改變不會這樣的說尊重, 而今天我看到一句某 ETBlue 說的話很不錯:

"我覺得很多不值得尊重的長輩,都會特別在意晚輩是否尊重他耶。XD"

也就是說, 原本 "尊重" 若是放在對等的架構上, 說不定該是很不錯的, 但通常都不是這樣, 大部份都是放在 "長幼, 尊卑" 等等的威權上下中使用的, 強調 "身份" , "場合", 來去強調自己的 "權力", 當有人去挑戰他的地位的話, 就會跑出 "五個不尊重" 的言論出現, 更有公權力的威權系統去保護 "尊嚴", 畢竟只有威權才能制止 "不尊重" 的人, 尤其是那些不夠格的人, 本來就不該出現在對話場合, 要夠格才能站在講台上, 至少我們可以肯定的他不會叫他那些 "社會地位" 高的人來 "尊重" 他, 不然這機制就失去了發揮的價值.

的確人是應該互重,  更要自重, 要不要去 "尊重" 他人是自己該去思索與行為的, 而想要去要求他人來 "尊重" 你, 通常是你做了一些不值得被贊同的事, 更是因為你的權力與地位做出迫害別人的事, 此時你都不尊重別人了, 想要別人尊重你, 就是標準的 "雙重標準" 或 "階級意識" 了, 或許當你說出這個字詞的時候, 只是再次證明你是 "高級知識份子" 罷了....


尤其是你更不值得 "尊重" 時...

2011年11月16日 星期三

如何經營 (衝高) Google + Page 的幾個方法

從 Google+ 發表 Page 的功能 (上星期二) 到現在, 已經有一個多星期了, 台灣推估已經有上千個到兩千多個專頁已經成立了, 但如經驗告訴我們, 其中只有兩成已經抓到經營的重點了, 或是已經開始經營了, 但大部份的還是沒抓到方法, 甚至都還沒開始, 而這邊不想宣傳 Google + Page, 畢竟我不是傳教士, 而我是想寫這篇給那些想經營而不知道怎麼經營的人看的:

在這邊我想先引用老貓的幾個重點, 這樣我就不用重覆寫了, 畢竟他的文筆比我好很多, 所以內文大家自己去看:

一、 你要舉辦活動

二、 你有一個特別的名字需要讓人找得到

三、 你想經營一個主題頻道

四、 你想經營社群

這是四個很標準的前提, 當然除外還有幾個重點, 我寫寫大家看就好:

1. 五張圖一定要放上去 (圖示及四張說明圖): 目前專頁能夠美化的大概只有這部份, 若沒有的話完成度會給人感覺很差, 能夠一眼能夠讓人看出是甚麼東西, 圖是最重要的, 因此這是一定不要忘記的.

2. 好的名稱與描述: G+ 既然是 Google 的, 所以搜尋是很重要的, 因此要有內容給使用者搜尋, 而名稱標題與描述是第一個被搜尋到的, 只是名稱不能太常, 畢竟太常的名稱會給使用者很不好的感覺, 甚至內容呈現會很糟糕, 所以可以在描述中完善自己的項目.

3. 一篇公開的文章: 除了上面兩點外, 還有至少一篇公開文章是很有必要的, 當然若是你不想公開的, 這倒是無所謂, 但若這專頁是為了要公開若沒做的話, 就很糟糕了.

4. 主站要有連結: 當然若沒有主站的話, 最好做一個主站, 因為有時無論是主站宣傳專頁, 或專頁宣傳主站, 都是相輔相乘的, 相對若沒有主站就很難行銷與經營, 現在 Google+ 也認為主站的 Badget 是很重要的認證方式.

5. 找宣傳管道: 宣傳與行銷總是最困難的, 上面說的 2000 個以上的專頁, 有一半是沒有人追蹤, 或是只有他一個人, 當然找人宣傳是最直覺得, 但要想辦法做出特色讓人幫你宣傳雖然是最好的, 但也沒那麼簡單做到, 親朋好友是最快的, 辦點活動或給些幫你的朋友一些好處是有必要的.

6. 串聯與名單: 在目前的 100 大, 幾乎都是專頁開放前兩天內成立的, 所以很多名單都有在上面, 現在已經沒有這樣的機緣了, 但因為 Google+ 有分享名單的功能, 所以整理出好的名單給大家再分享也是不錯的方法.
7. 寫出好的內容: 這是最最最最最重要的, 也是行銷效果最最最最強的, 只是這也是最最最最困難的, 因為再怎麼找人宣傳, 都還是很標準舊式的行銷, 但能夠寫出使用者願意幫你分享的文章, 這才是新思維的行銷, 只是沒有人可以天天寫出不錯好的內容, 所以唯一的方式就是認真的每天寫內容, 總會慢慢抓到如何寫出好內容的思維, 提高寫好內容的機率.

一個好的專頁不能只從粉絲數來決定, 畢竟好的專頁還是在於影響能力, 而影響能力取決於互動的信任, 如何經營好的專頁除了行銷外, 最重要的還是本質, 就是內容, 然後就是衡量的方式.

而 G+1圈圈報 (G+100Paper) 也在寫一個系統, 讓你計算出你專頁經營的指標, 而不只是粉絲數, 經營是一個連續性的行為, 而不是只是一時, 想要知道你專頁的狀況的, 可以去台灣 G+專頁 排行榜輸入你的網址, 會讓你更了解如何經營.

2011年11月3日 星期四

從流量來源的演變來看 SEO 2.0

在上個星期辦 iSearch 之前, 我一直要整理一些不同的 SEO 觀點, 說是 SEO 2.0 太沉重與無趣, 因為現在不只是 SEO 黑的白的一堆, 叫 2.0 的更多, 還有 SEM 等新名詞來攪局, 但我也很無奈的用這名詞, 總不能用 Mark 2 或 Next Generation 吧?

一開始要說的是, 用 網站流量來源的策略來經營流量, 然後跟 SEO 相輔相乘, 而以紮實的內容與認真的經營才是王道, 而那天雖然寫了一份投影片, 但總覺得那天講得不夠好與意猶未盡, 所以我就想到來寫這一篇文章來再重新詮釋.

在早期的網站流量是來自於下面三項:

1. 直接流量
2. 網站推薦
3. 搜尋引擎

以現在的觀點, 直接流量是以前最主要是靠瀏灠器書籤 Bookmark 的方式來進入網站, 而現在已經越來越少人這樣做, 以及在三四年前的書籤網站也隨著新的 SNS 成熟而消失, 甚至郵件的使用也變成 Webalization 的網頁化後, 都變成另類的網站推薦, 事實上現在直接流量來源倒不是 eDM, 也不是 Bookmark, 連 MSN 也變少, 在台灣靠的是 BBS, 而說穿了主流就是 PTT 了.

相較直接流量, 網站推薦變得越來越多元, 但就經營的觀點來看, 無論是 SNS, 書籤網站, 廣告, 推薦系統, 網站連結都是有不同的經營策略, 網站推薦已經不能用以前很簡單觀點來看, 而是針對屬性去作切割, 事實上搜尋引擎這種的來源, 也都只是一種另類的網站推薦, 而隨著搜尋引擎本身就擁有流量工具以及廣告工具, 知道網站的流量已不是難事, 甚至大家都知道流量也變成一種很重要的 SEO 方式, 雖然以前有太多人用假流量去做 SEO, 這是很糟糕不足取的事.

而我現在是希望大家可以擺脫或進化上面的想法, 進一步用網站經營與行銷的觀點來看 SEO, 也就是依流量來源做新的切割, 來作不同的經營, 就如下面五項觀點分割:

1. 搜尋引擎的 SEO
2. 社群網站 SNS 
3. 時效性連結
4. Hard Link (實體連結)
5. 網路廣告聯播與關鍵字廣告


上面五項的流量來源並不是技術面的切割, 有些是屬於傳統三項的一小部份, 有些反而是兩個不同的來源, 差別是在是以流量來源經營的角度去看的.

搜尋引擎的 SEO 雖說是這篇文章的重點, 在早期甚至只是兩三年前之前, 我都會說搜尋引擎來源應該是占三分之一, 對於超過 80% 或低於 20% 的狀況都認為是不夠健康的, 雖然現在還是會以這樣的觀點來看, 但更認為體質的分配本來就沒那麼嚴格, 若透過其他來源的流量太多導致搜尋引擎來源比例太低也不是很糟糕的事, 比較糟糕的是整個網站對使用者或對搜尋引擎的不友善, 也就是 User Oriented Friendly 及 Search Engine Friendly 的重要性是更高, 而之後在網站經營的主題有一定的排名, 且主打與長尾都很均勻這才是重點, 反而該透過 SEO 的來源而失去, 是最不想見到的事, 尤其是現在角度來看, 除了自己網站做好之外, 外面的導流與連結是將是未來 SEO 的重點之一.

說到導流, 以現在的角度來看, 社群網站 SNS 是目前網站流量的最大宗, 雖然這個是蠻不穩定的, 因為不可能網站所有的新內容與新商品都能夠受大眾的歡迎, 有時候有好東西會獲得大量的注目與焦點, 雖然這有操作的技巧, 但無法保證每次都是有巨量, 雖然 SNS 社群網站帶來暴發的巨量是讓網站流量成長, 覆蓋率增加, 知名度提升最重要的事,  但穩定持續的在 SNS 經營才是必然的, 就像是通路商知道得獎, 去逝等等新聞事件是占整年業績的三分之一到五分之一, 只是你很難去操作這部份, 好好的把剩下的部份有穩定的成長, 當基礎變得夠大了, 才能去拿到更多的三分之一到五分之一.

只是我們很清楚的知道 SNS 的經營若是以 Facebook 臉書來看來源可以區分兩種:

1. 個人網絡的資訊傳遞
2. 社團粉絲頁的經營

這兩個方向的經營以現在的角度來看是後者越來越重要, 畢竟前者的個人傳播網絡是很難去操作, 但若網站本身有好的社團粉絲頁, 有足夠的參與人數與活躍度是讓網站活動能夠短時間內被知道的最好方法, 畢竟一個網站再好很難讓人天天來, 但社群網站是不一樣的, 太多流量來源來自於社群網站, 無論是來自於 Facebook, Plurk 噗浪, 或是 Youtube, Google Plus, ....

社群網站的經營又是須要靠不只一本書才能講如何操作的內容, 但這篇要講的重點是這部份的流量來源應該也是在於 20% 到 80% 之間, 取決於有沒有熱門話題, 且一定要經營 SNS, 尤其是社團粉絲頁更是重點, 在行銷策略中不能放棄這一塊, 大家知道這樣就很夠了.

除了 SEO 與粉絲頁, 時效性的連結也是相當重要, 那些是時效性連結呢? 以台灣的角度來看是下面幾項是常見的:

1. 論壇與討論區
2. PTT
3. 新聞
4. 活動
5. Bid, EC

雖然說像 PTT, 新聞, 上面這些網站, 只有很短暫幾天內的有效期, 因為這些網站只要時間過了, 不是沒人看就是被封起來, 但在這之前常常會看到有人會去轉載變成長效性的 HardLink, 雖然這些網站的經營策略都不太一樣, 例如新聞或論壇就靠業配文, 廣編稿, PTT 又是另類的經營, 但在做這些有時效性的連結之前, 一定會有一個活動, 活動的內容可以說是這部份行銷的主軸, 雖然這方式在一開始就知道只有一定的時效, 且成本高, 但看在真的可以帶進流量的情形下, 真的要分配一些預算在這邊, 而不是只知道投放曝光式廣告而已.

有在經營網站 SEO 的人都知道連結有兩種, 一種是不會被搜尋引擎收入, 或是純脆透過原網站或第三方點擊轉址的系統的連結叫 Softlink, 相對直接寫在 Anchor 的 HTML Tag 叫 Hard Link 實體連結, 實體連結是現在在 SEO 的比重越來越重要, 但要有優質的 Hard Link 卻是比任何其他 SEO 方法都還要困難, 除了策略聯盟外都是可遇不可求, 甚至連優質的策略聯盟更是難得, 現在能夠的話只能透過一些小眾媒體或有認真經營的部落客來做到是比較有價值的, 以現在的角度來看這些都是有價的, 且好的 HardLink 不是開價就買得到, 雖然一開始流量並不可觀, 但因為有可能越滾越大或者是長期對 SEO 的影響之鉅, 是最不能忽視的一環.

若是把行銷預算全部丟給 網路廣告 是最笨的, 但相對的完全沒有把錢放在曝光式廣告, 點擊式廣告, 部落格廣告, 廣告聯盟, 內文式廣告, 關鍵字廣告是比最笨還要更笨 (雖然這句話有語病但也是真的), 因為網路廣告跟傳統廣告即使再不一樣, 都有一個相同點叫做 "覆蓋率", 採取越多種方式去行銷的覆蓋率往往也越高, 只是在於多樣性會不會增加負擔與跟預算的稀釋, 在其中取得平衡是須要很多經驗的, 但網路廣告的成本往往比傳統平面或電視廣告低很多, 通常多幾樣是死不了人的.

上面這五種網站流量來源所背後的行銷方式只是種大要, 最後還是在於網站的屬性來決定該用那一個或那兩個做為主要的方法, 我通常建議是每一種方式可以用 10%~40% 的行銷預算來去執行, 也就是最低不要超過 10%, 最高也不要到一半的觀點去分配, 也就是說不能偏廢也不該是唯一, 的確該是有一兩項是 30%~40% 占掉一半以上的行銷預算.

拉回來上面講這麼多跟 SEO 有甚麼關連呢?

除了跟上面所說的流量也是衡量 SEO 很重要的一環, 上面幾項方式或多或少都會創造連結, 而除了自己有讓別人引用管道外, 更重要的是如何做出好的內容與商品讓人願意討論與引用, 然後配合這些 SNS, 聯播, 廣告系統等等的行銷方式, 這才是 SEO 2.0 的王道.

下面是那天的簡報, 這篇文章目的是把投影片串起來讓大家可以懂, 不然只光看投影片是很無趣的, 而我那天講的也有不夠好的地方, 所以也再寫出這篇文章再加強讓大家了解.

2011年10月12日 星期三

APEC Tel 44 後記

在參加 APEC Tel 43 時, 就應該好好認真再寫 APEC Tel 的參訪記, 畢竟那一次是拿國家的錢出去, 這次是用公司的錢, 雖然我上次自認為應該不會愧對納稅人 (包含我自己), 但那次是去 GFW (Great FireWall) 禁區, 一個星期無法正常工作下, 回國須要兩三周才慢慢把工作補完, 那時再寫已經失去時效性與沒甚麼記憶了, 而這次是只去 3.5 天, 但在網路自由的國度下上網真是好事阿, 所以現在已經可以提筆 (事實上是電腦)  開始寫了.

我去的 APEC Tel 是指亞太經合會下的 Telecommunications and Information Working Group,  在 APEC 下面有 13 個 working groups, 相較 EU 歐盟這已經完整運作的實體只有 8 個 Working Groups 是嫌多了一點, 但本來工作小組是個際運作的組織, 相較論壇 (Dialogue) 以及委員會 (Commuttie) 有不同的運作方式, 雖然說我早就知道亞太是個短時間不可能跟歐盟一樣運作的體系, 甚至有人說這是時代的產物, 亞太經合會本來就是非強制性的組織, 在某方面是交流多於約束.

台灣代表團 
但就 APEC 而言, 台灣雖然是掛 "Chinese Taipei" 中華台北的稱號, 但由於 APEC 一開始就以 Economic Entity 經濟體為稱呼單位, 而不是國家 (Country), 雖然在會議時常有口誤, 但文件倒是大部份都是很認真的檢查, 口頭上的錯誤是很常見, 說個 Sorry, 再更正也不會怎樣, 甚至大會主席也會說錯, 而由於上次 APEC Tel 43 是由中國大陸主辦, 所以這次北京方面只有派出 8  位成員, 且只有一位年紀超過 40 歲, 我後來回頭看簡報上還真的有不少 Taiwan, 但他們都忘記抗議或不以為意吧, 因為上次是我主要報告, 有人幫忙檢查, 這次我只有去協助回答問題, 因此並沒有刻意去注意這個以我角度不重要的事.

因為 APEC 是少數台灣在正式場合以同等的地位參與, 即使其約束力不強, 但在機會少的情形下, 參與度本來就應該要更高一些, 在 APEC 的大國應該也算美國, 俄國, 中國, 但日本, 韓國, 台灣也是活躍度相當高的, 尤其台灣 APEC Tel 是由 NCC 國家通訊委員會來主辦, 這會議也是國際組一個重要的活動, 所以 NCC 對這會議算是蠻重視的.

在做報告時的側拍
這次算是數位文化協會跟二十一世紀基金會在 APEC 的一個活動的結案報告, 雖然說這案子沒有如我們所預期的在幾個國家實現 (Practice), 但至少能夠變成一個 Case Study 案例也是我們所要求的低標, 除了讓這個 SNS 在災害管理的價值被呈現, 也更希望多少提升一點台灣的能見度, 因此 NCC 也一直問我們若這案子結束後還能夠再提出一些案子來貢獻.

事實上也並不須要一定是由官方來弄, 像我們就是非營利機構, 而國外也有營利機構來參與跟提案, 或者是協助顧問的角色, 只是我比較覺得可惜的是像資策會如此明鮮的跟 Telecom & Info 如此相關的單位在這邊沒有報告或提案是可惜的.

在 TEL 的 WG 下有分三個小組:
這三個小組有各自的會議, 而大會也會舉辦一些圓桌會議 Roundtable, 以及 Training Session 與 Seminar, 只是這些都是有其專業的議題, 有時也蠻值得參與的, 像這次就有舉辦 Disaster Management 災害管理的 Seminar 研討會, 這也是因為像我們這樣的提案聚集越多所造成的.

這次去馬來西亞, 我的任務原本只是回答其他參與的 "經濟體" 代表的問題, 畢竟我本來就是參與度較高的人, 但後來因為衝堂的關係, 我在第二天的報告被趕鴉子上架, 幸好年初的經驗算夠, 雖然表現不好但差強人意, 畢竟我們算是有蠻多東西可以報告的, 且其他的代表, 可能都是高官, 那些官員大概只能照本宣科一遍就了不起了, 或是又是太工程師報告的快睡著, 所以再怎樣我的報告都很輕易的到中上以上的程度, 而 Workshop 的 Convener  一直在我旁邊偷笑, 害我一直以為我有做甚麼糗事, 事實上是有啦, 因為比我預期的早開始, 我是遲到了一會, 所以先跳過我後才再輪到我報告.

最後因為下次不會有我的提案了, 應該是無法再去參加, 不然說真的這樣去一次也對每個國家有不同的感觸阿.




2011年10月4日 星期二

恐怖的公車

剛剛坐到一部相當恐怖的公車, 但不恐怖不要打我...

因為是下雨天, 所以是坐公車從淡水捷運站來回通車的日子, 很幸運的一下捷運還沒刷卡就看到紅 26 從我面前經過, 即使我身上帶著 5 公斤重的 "老四川" 鍋底, 我想只要快步走就可以趕上, 跑是不可能也不須要, 只是一定不可能有座位坐.

果然趕上公車已經沒座位了, 所以把 5 公斤的湯與接近 10 公斤的書包放在前輪置物處, 想說待會若有座位可以坐就好了, 通常這時候 10:30 的公車是載著學生回宿舍的好時間, 所以我想到真理大學應該就有座位可以坐了....

因此在到重建街之前, 幾乎所有的乘客是只上不下的, 過了淡水圖書館就開始沒有人上車, 畢竟這是個交會點, 只是車子開到紅毛城時此時發生相當驚聳的事......

一到紅毛城站, 司機看到快紅燈了, 雖然站牌是在紅綠燈前, 但司機勉強過了紅燈後停下來, 打開車門說 "紅毛城站到了", 雖然在之前沒聽到有人按下車鈴, 但整車坐滿 50 人以上, 想當然爾一定有三分之一或二分之一的人會下車, 但此時居然沒有人下車.

司機吃了一驚, 想說有些學生還在睡覺, 就改口說: "紅毛城, 真理大學", 此時想著說應該會有人搶著下車吧, 但所有人還是眼神呆滯, 好像不關己一樣, 連我都覺得有點怪怪的了, 過了十秒, 此時司機再說一聲: "真理大學", 從他顫抖的聲音我猜他已經快哭了, 我也感覺我是不是該奪門而出呢? 我是不是坐到一班幻之公車, 就像是 7:50~8:10 有一班沒人坐的幻之捷運一樣?

過了一會, 司機覺得可能遇到鬼打牆, 門還沒關起來就趕緊繼續往前開, 好像要逃命似的, 我此時往後看, 看看每一個人, 好像臉色並沒有很蒼白阿, 到底是發生甚麼事呢? 還是真的遇到神奇的機率, 若是這站有 1/4 下車的可能性, 但整車 50 人沒有人下車這機率是 (3/4)^50 阿, 幾乎是百萬分之一以下阿....

或許這班車一直是淡水古蹟公車, 常常經過忠烈祠, 雖然這班車是新車箱, 不是跟照片一樣舊公車, 但說坐上一班滿滿都是不該出現的東西的車也不是不可能阿, 機率應該比完全都沒人在大站下車一樣低阿, 難道待會真的整車會發生甚麼事呢?

在無法下車又無法確定到底是那些生物或非生物坐滿滿公車的情形下, 我只好想著 "臨兵鬥者皆陣列在前"......

後來這班紅 26, 繼續往前開, 終於在淡江新村下了五六人, 而後天生國小下了三分之一, 而到淡水拖吊場時整車人幾乎都下光了只剩五個人, 我也在此時趕緊下車, 真不曉得待會這班公車開到淡海以及漁人碼頭會發生甚麼事, 我連想都不趕想的逃走了....

2011年9月26日 星期一

G+與臉書, 那噗浪 Plurk 呢? (Facebook 粉絲的可怕)

雖然我並沒有 "效忠" Plurk, 但自從做了 Plurk.tw 後, 當然說重心放在噗浪是沒錯, 畢竟我認為噗浪的 "二次時間軸" 比 Twitter 個直覺可以討論聊天, 不用強迫自己成為資訊貧乏症候群的人, 也沒必要成為 "傳教士"....

但自從 Google+ 起來之後, 明顯的發現 G+ 對部落格有推播助瀾的效果, 甚至在某方面比 Plurk.tw 的討論串 Plug-In 更有討論性些, 雖然這跟 W2C 計劃比起來還不見得有意義些, 但已經在散播性已經沒有問題了, 例如從這個部落格 (黑貘來說) 來看, 其流量來源發生了很大的變化.


從上表就可以看得出來, Google Plus 幾乎在短時間就取代 Plurk 噗浪的地位, 更居於主導的角色, 原本噗浪是流量來源的主力, 而之後變成 G+, 但此時可以看得出來 Facebook 也慢慢的增加流量了, 甚至也超過 Plurk 了.

但若這篇只有這樣就太無趣了, 昨天寫了一篇文章, 結果被一直轉寄轉貼, 流量大增, 我本來以為是 G+ 所造成的, 到後台一看, 發現完全不是這麼一回事:


居然有超過 8 成的 Referral 是來自於 Facebook, 甚至應該說是有 87.5 是來自於 Facebook,  幾乎是 9 成了, 我在想我本身是沒在經營 FB, 且我連貼都沒去貼, 怎會發生這種事阿? 趕緊 Google 一下, 原來是有 104 及 Facebook 社群行銷學在幫忙轉貼, 尤其是 Facebook 社群行銷學的粉絲團單單的討論在當天就有118 人說讚, 36 人分享, 這可能是造成如此流量的原因... (現在這數字雖有增加, 但不多)

  
因此從這邊來看, Facebook 的粉絲影響真的很大, 雖然 104 的人數比 Facebook 社群行銷學人數多, 但熱度是十萬八千里, 但也看得出來一個有在經營的粉絲團所造就的流量是相當可觀的, 因此我的部落格累績下來目前是這樣的狀況:


目前還是噗浪占三分之一 (三成), 而 Facebook 慢慢的到 13% 了, Funp 已經慢慢消失了, 而 Google Plus 已經快超越了.

雖然我們早就知道在台灣 Funp 已死 (對不起大河馬, 反正他已經沒在在意了), FB 變成主流, 而 Plurk 漸漸失去台灣傳播力量主導力量, 而虎視耽耽的 Google Plus 想取而代之, 而 Twitter 一直是老三.

當然 FB 在這段時間的改版, 會不會坐穩主導, 不讓 Google Plus 超越, 這是有趣的狀況, 至少可以知道目前認真經營粉絲團是很有用的.

2011年9月24日 星期六

工作與學習 (Continue, 中)


說到上一篇講有關在工作與學習的文章, 是蠻不合我的寫作風格的, 因為我的文章大部份都是蠻概念性的, 倒是很少寫的如此實務, 雖然後面還是我寫了一堆模糊的說法, 說這是我初步的想法, 因為我的原意的確是希望大家能夠在工作中實現自己生活的期望, 若我真的要我說教, 我一定會叫大家先不 "應該" 去想甚麼收入百萬千萬, 而是好好去找出自己與社會的關聯,只是我知道這樣說不太可能會有人聽, 所以換個角度用比較 "主流" 的思維去寫.

但這一篇被到處提及時, 大概看了一下大家的討論與想法, 那些看得下的人, 已經早就了解這樣的路逕 (Track), 可是原本我是想寫給許多以為還在努力為了賺錢而學習, 但不想去增加自己專業能力的朋友看的, 尤其是有一些人花了大部份的時間去學習如何 "成功" 與 "賺錢", 但就實務做事的能力長進的非常有限, 這才是令我覺得可惜的.

雖然有人問我唸那些書, 我那篇已經說了一個簡單的做法:

1. 唸教科書到最基本的能力.

畢竟教科書雖然無法對直接實務上有幫助, 但花上半年瀏覽一遍感覺會更深刻, 尤其當你出社會四年了, 現在回頭看四年前念的 "管理學", 感觸也不太一樣, 即使是 "計算機結構", 過了十年是完全改寫的,  即使你自認為已經唸過研究所不須要再重唸, 那是假的.

2. 那一篇也提到 "ㄐ一ˋ", 也就是經濟會計與統計.

這三計雖然可以被簡稱為 "快(會)要忘記, 已經忘記, 通通(統)忘記", 甚至加上原本只是 "記(計)個大概",  大一唸與出社會唸還是不太一樣, 更何況是完全不知道在唸甚麼樣的人, 更是須要再唸一次.

事實上除了三計外, 我認為所謂 "法學緒論, 通史概論, 比較政府/政治/社會, 國際關係" 這種不要說是上班族該唸的,  只要是人都是須要有基本以上的知識.

有人說我是依老賣老, 這也是真的, 因為我也走過許多人一樣的道路過, 雖然我也沒有說走得很不錯, 但以最沒有意義但最簡單的價值判斷 -- "收入" 來看, 我是在沒有從事管理階層中收入蠻高的, 加上我真的是靠 "上班族賣時間" 來賺錢, 因此更不會亂花錢而心安理得, 在工作與自我成就找到一個平衡, 雖然我是到 35 歲才慢慢進入狀況, 但我相信有很多讀者應該更有能力或比我更容易融入社會找到自我價值才對.

我現在回想我為甚麼能夠這樣, 多少也是我對專業技術的基礎, 雖然無法到學術研究的程度, 但對上班族應該是足夠了, 而我能提供的只有給 IT 的人建議.

3. RFC 至少唸 50~100 篇, 歐萊禮的書總數至少要超過 50 本, 最好有一個顏色是唸一半以上, 看你的 IT 領域是甚麼.

上面這句話我不是用喊的, 因為我是唸上面的數字三四倍以上, 大家若有機會看到我以前的文章, 就可以看到我有很大的感觸, 專業沒有捷徑, 就是認真學習, 很多人一直問我能不能把書單濃縮成三五本, 我都說即使乘上三五倍我都還覺得自己還不足,

事實上我都一直認為人自己都知道自己要唸甚麼, 因為連自己的專長都不知道的人, 表示自己還是沒有專業化, 也就是說他職業的專業是在實體書店都可以買得到的, 完全不須要去網路書店去挖書, 且說不定在縣市圖書館就找得到, 我曾算過新北市的歐萊禮的書大約有 50 種以上, 台北市應該會更多, 而若你是在 IT 公司上班的話, 公司一定會有預算買書, 若沒有預算的話, 離職說不定會比較快 (開玩笑但認真).

當然最麻煩的問題都還不只是你不知道該唸甚麼書, 而是你自以為是專業, 知識早就足夠了, 不須要唸書, 或覺得唸書沒有意義, 這思維才可怕的.

4. 若一個說他自己是 SEO/SEM 專家的, 而沒唸過十幾本或幾十本 SEO 專業書, 我認為他只是從業人員水準.

或許在 3~5 年前, 我說十幾本會被那些人攤手, 說中文的書只有幾本, 但現在已經沒問題了,  因為中文書現在已經說不定有 20 本了, 當然這種新的工作領域的書, 還是以英文或日文是完整與關念較新的, 雖然我也知道從網站可以獲得不少的學習, 甚至最新的觀念書上是不會有的, 只是書是最好最完整打基礎的方法, 基礎先建立後再從網路上跟上是最合理的方式.

當然, 拉回來是你若連所謂從業人員水準都談不上了, 更何況說要成為專家, 說收入一直在三四萬排徊,  只靠年終與年資加薪, 這才是最可惜的事了, 而說那一天要靠變成管理階層來破七萬, 說不定都還不夠踏實.

唸書跟學歷雖然有相關, 甚至是正相關, 但卻不是充份必要條件的去劃上等號, 甚至連唸書也不是, 因為我真的知道專業是來自於 "認真的做10年或做10萬小時", 所以重點是在於心態, 而你的心態是真的想要成長嗎, 還是只是賺錢呢?

2011年9月21日 星期三

從 Google + > Plurk 來看幾個 G+ Monitor

在剛剛, 發現我的 Google + 的 Connection 連結數正式超過 Plurk 噗浪了, 只是前者是花不到 3 個月, 但後者是超過 3 年又 3 個月....

當然我們很清楚的是網站本身有母雞帶小雞現像, 拿 G+ 跟 Plurk 比是很殘忍的事, 但也是因為昨天 G+ 一開放後, 又有一個小量的暴充所造成的, 不然我以為還要再晚個幾天, 上表是我整理出來 Twitter, Facebook, Plurk 及 Google+ 加入的時間與好友/粉絲/追蹤/被追蹤數, 整體而言就是連結數, 而我在 LinkedIn 的連結數是 108, 算是控制的很好. 下面幾個表是我的 Screen Capture 做紀念的...




雖然說這三個不同的 SNS 在台灣也是不同的使用方式, 且每一個人的喜好不同, 其成長方式與連結數本來就不太能同一而論, 甚至其資訊傳遞方式也不太一樣, 本來就很難比較, 但這邊文章的重點是來講幾個 G+ Monitor 的效率與功能.


上面是幾個 G+ Monitor 的功能與效率的差異, 從這邊來看可以得知幾點:

1. 更新頻率: G+Statics 與 Plus Alyzer 較好, Circle Count 次之, Journal+ 與 FindPeople on Plus 更新較慢.
2. 收入數(覆蓋率): Circle Count 較好, 相較 Plus Alyzer 好像收錄的有問題.
3. 功能面: All My + 與 Journal + 在文章比較有多的分析, Plus Clout 較有趣些.
4. 歷史記錄: Circle count 與 G+ Statics 勝出.

綜合上面幾點, 似乎註冊 Circle Count 就很夠了, 而在 API 推出後, All My + 是利用到 API 來做分析的, 所以預期可以分析出不少東西....

而上面幾個的截圖可以去 Picasweb 看, 我不是好的編輯者...

職場的學習 Learning in Career Track


在兩三年前, 跟 "史公" 聊到一個有趣的問題, 就是他感嘆台灣教育在結構上有很大的問題, 大部份的大學教育, 其課程都想教人成為頂尖的人物, 例如 "李安", 且很多學生也都的確以這為目標, 但我們都知道, 李安在沒當導演之前, 也當過好一陣子的編劇, 場記等等基礎工作, 但很多剛畢業的學生以為第一份工作就可以找到導演的工作.

剛好過不久後, 我們面試到一個很 "不錯" 的 "人材", 他是某私校大學畢業後考上 T 大研究所, 還參與某 MS 公司的精英培訓計劃, 拿出漂亮的履歷, 談吐儀容都相當好, 但後來我們並沒有用他, 這是為甚麼呢? 因為下面對話:

"你有做過網站嗎 ?"
"當然有阿, 我在 MS 公司參與了很多次網站企劃 !"

"嗯, 感覺你是個不錯的人, 我們須要有一個能夠去把網站架構出來的人, 你應該做過吧 ?"
"沒有, 這些都是 PM 與 SA 該做的事, 我不做那些事 !"

"阿, 那你應該會一些基本的網頁設計吧 ?"
"不, 這些是美工與程設該做的事 !"

"那你有用過甚麼網站規劃的軟體嗎 ?"

"沒有, 這不是我該做的事."


"那你在網站製作扮演甚麼樣的角色呢 ?"
"我是負責網站的策略規劃, 那些下面的人做的事我並不了解."

"喔..... (飄)......"

當然這個人材最後還是 "忍痛" 放棄了, 因為我們沒有像 MS 那種大公司可以請一個 22 歲研究所剛畢業沒有職場工作經驗的人來做專職網站策略規劃, 這無關他要求薪水是 6 萬.

不得不否認, 要成為一個好的資源管理經營策略規劃的人材, 也不是那麼容易, 須要很多經驗與學習, 但這些學習是不是只靠拿到 T 大 MBA 或更高的管理學歷就可以呢? 這關係並沒有那麼密切, 雖然說在職場的每一個人, 都應該學習如何管理, 如何的經營與投資, 但這是否是在你一剛出社會就該花最多時間在學習這方面的呢?

後來我也遇到不少這樣典型的人, 很多人的目標都是年薪百萬或千萬, 但他現實的薪水只有 3 萬, 下班後一直研讀川普的書如何經營, 也在看老葛的書如何投資, 但卻絲毫不覺得須要在他現在的工作技能下努力, 他認為唸這樣的書是永遠無法達到他的 "美好人生" 的目標, 那些書學完了還是只能當個苦哈哈的上班族, 這樣想也是沒錯啦, 但總覺得有一種說不出來的怪, 難道把川普的書唸完你就可以當經營之神嗎?

若是把書分成三種:

A. 專業類: 能夠把你在職場所須要的技能與專業, 或者是對產業與工作的了解, 以及其相關基礎學習的書.
B. 管理類: 對職場的管理以及人際關係所須要的技巧, 包含產品管理等企劃所須要的背景知識與技巧.
C. 經營類: 如何能夠投資創業, 公司營運, 以及如何成為一個好主管等的學習.

這三類的書都很不錯, 但常常遇到兩種狀況:

1. 只是一個剛出社會的員工, 但天天看的是經營類的書.
2. 接手管理階層, 但還是沒有去念管理類的書.

這兩種狀況當然都不是很好, 但也是還蠻常見的, 而在之前常跟朋友聊到此現像, 他倒是問我那該如何去做界線與階段呢? 事實上這三類並沒有明顯的分野, 往往只是比重的不同, 因此可以用量化來大約呈現其階段, 而說到在職場的區分, 最簡單的劃分是用薪水吧:

薪水 2~5 萬: 專業類佔 60%, 管理類佔 30%, 經營類佔 10%.
薪水 5~8 萬: 專業類佔 30%, 管理類佔 50%, 經營類佔 20%.

薪水 8萬以上: 專業類佔 10%, 管理類佔 40%, 經營類佔 50%.


這也是說, 剛踏入職場應該是想辦法讓自己的專業技能的基礎跟基打好, 當你的薪水靠專業能力達到 5 萬以上時, 再來多唸一點管理的書還不遲, 而在這個階段不應該是以管理經營為主, 只是專業的書是甚麼呢? 就真的每一種職業都不太一樣, 雖然我很開玩笑的說, "三ㄐ一ˋ" 說不定是每一個人都要唸的.

當然這薪水指的是台商, 而若是外商的話可能要加個 30% 到 70% 的薪水才是合適的區間, 甚至在產業與台灣的不同地區或多或少不一樣, 事實上你應該從你公司的職稱很容易的判斷在你的領域應該如何分這三階段.

但更重要的是這是一般通論, 可以放在心理就好, 個體差異還是存在的, 但要了解自己與了解社會以及自己所扮演的角色是相當重要, 然後自己在做決斷, 就像是我現在是專業類 60%, 管理類 20%, 經營類 20%, 但我的薪水早就超過這量表很遠了, ....

(但這也是指職場的書, 還是要多看點對社會的學習, 以及更重要的 "閒書", 這才是生活的重點阿...)

2011年7月29日 星期五

悠遊卡踩 6000 次了....


昨天終於悠遊卡踩到 6000 次了..

6000 次 2011/07/28 (1 年 1 個月又 10 天)
5000 次 2010/06/18 (1 年 6 個月又 27 天)
4000 次 2008/11/20 (1 年 8 個月又 13 天)
3000 次 2007/03/07

為了記錄通勤的活動, 刻意把消費的悠遊卡分開, 所以現在身上都會帶兩張悠遊卡, 只是也發生幾次通勤忘了帶卡改用這另一張國泰世華的卡, 不然應該會早個幾天, ...

只是前 500 次幾乎是花不到 4 個月就達成, 因為那一陣子到處跑, 以為這次一該不到一年就會超過一千次了, 但結果還是超過 1 年, 但也是較快的一次.

像這張卡, 就純脆只在店家消費, 本來以為應該會有很多次, 但我剛看了才 128 次, 當然是因為沒計算 7-11 的 icash, 我還用壞一張 icash 說, 在想有沒有可能將那張卡的資料給倒出來, 不然很可惜說.

2011年7月19日 星期二

家中第二螢幕該如何買的選購指南 (上? 應該不會有下)

大家已經看煩我寫一堆三螢幕, 四螢幕, 五螢幕, 甚至六螢幕的文章, 因為大部份的人都都一句話給我: 我書桌座位沒這麼大啦, ..... 當然我就會說: 換個房子吧.... 接著我就被打了....

當然說要因為要多螢幕要換桌子, 換房間, 換房子, 換工作, 換生活, 這樣的思維有點本末倒置, 所以我也只能苦笑, 但說起來有時因為我提出更高的要求, 就是你到伯朗咖啡工作, 還是可以用雙螢幕與三螢幕的須求, 這議題我好像也寫過了, (但可能是寫在 Plurk) 或是放在 Flickr 的照片, 而我也花了不少錢與時間在找這答案上面, 雖然現在也不算找到, 但也是有某種 Solution 了.

而上圖是某日本推友的照片, 通常這個理論上只會在劍魚這種電影才看得到, 不然就是做 NOC (Network Operation Center 或看盤才會用得到, 而我看過最合理的使用方式就是 "草泥馬" 的工作平台是最合理的吧.
而下圖右邊是我在舊家的工作環境, 而我一到公司上班, 就只能用下面左邊這種方式了.

但因為最近 "家庭的關係", 我現在住的地方是一個共用的小桌子, 但對於用慣多螢幕的我, 如何去平衡多螢幕的須求, 但也能夠平衡家庭的須求, 也變成我要思索的問題, 而有那些問題呢?

1. 不能太大: 雖然螢幕是越大越好, 但就大螢幕對視線影響很大, 所以一定是 20 吋上下是極限吧.

2. 最好可以收合: 畢竟這是公用的空間, 那個螢幕一直放在那邊也是很占空間, 若是能夠方便的移動與收合是不錯吧.

3. 多功能: 若是這個不只是螢幕, 也是電視, 又能 skype 或 MSN, 這樣就不會覺得過於大而無當吧?

4. 攜帶: 若能夠也當其他用途的螢幕也是更棒了.
5. 顏色: 因為我家目前是白色系為主, 若是放個黑色的螢幕會很怪很怪.

有上述這幾點目標後, 接下來就是到處去找了, 而我第一個去想的就是收合問題, 而能夠收合的話, 我直接想到的就機架用的螢幕了(下圖), 這是不錯的選擇, 平常不用的話可以收起來當桌面, 只是顏色不太對, 甚至我在想要不要做一個像 Apple 螢幕的那樣 90度的角架, 但可以旋轉的話就太棒了.


但說要去開模做這樣的螢幕腳架是可以想想, 但真的要去做依我的個性不太可能, 我又不是鍵神, 所以想到的還是走 Portable LCD 的方向吧, 而之前的 Samsuang 與 Plus One 的經驗都不是很好, 而現在 Toshiba 出了個 14 吋的, 此時我眼睛就開了, ....
這個是一個只吃 USB 電源的雙螢幕, 但我知道 DisplayLink 對 Mac 的支援目前還是半調子, 且這款還沒進到台灣, 所以也只能想想就好.

只是在這次尋找的經驗中, 我就開始在想所謂的 Internet TV / Smart TV 的可能性, 此時就找到 Sony 這款 KDL-22EX420, 這款不只是背面是白色的, 又可以當電視使用, 不只做為第二外接螢幕, 也可以當第二電視, 且又能夠獨立使用當 Internet TV, 說真的我還真的差點下單了, 只因為他的解析度只有 1366*768, 所以最後還是沒有買.

我會寫這篇, 應該是上集, 因為還沒有真的去實現, 所以現在還在徵求意見與尋找中, 也把我目前的訊息給大家分享.

說真的, 在尋找的過程中, 還有一個讓我心動的 "Protable LCD"... 就是像下面的圖說:阿, 不要打我... 這才是極致阿...

Weather Mining, 到底有沒有下雨呢? 神貘天氣呀~~

(這篇是寫給在氣象局任職的某噗友看的, 若對這議題沒興趣的人可以跳過)

目前神貘天氣取樣了六個單位的預測, 希望以後還會更多, 但事實上要去 "Normalization/統整" 這些預報是相當不容易的, 所以一開始就是抓 Raw Data/原始資料.

一開始就做的溫度 KPI 是較簡單的, 就是預測當天最高溫與最低溫, 但這麼簡單的預測就有幾種變化:

1. 最高溫最低溫若是在預測多次不一樣的話, 就取最高值與最低值來計算.

2. 中國氣象台是把最高溫設為白天的溫度, 最低溫設晚上的溫度, 而晚上白天並沒有各自的最高溫與最低溫.

3. 比較好的預測是以小時為單位, 而不是以每天為單位, 所以本來有比較完整的預測為了比較就簡化成一天, 真對不起這些人.

4. 除了真實的溫度外, 還有 "Feel Like/感覺" 的溫度, 因為溫度也包含濕度, 風速等等的綜合評斷, 只是很可惜無法做為 KPI, 不然是個好東西.

5. Weather Bug 還有 "Dew Point/露點" 的預測, 風量與風向的預測也不少, 這個都是種參考.

6. 台灣中央氣象局等也直接寫出 "感覺", 像舒適, 等, 這個很難去量化當 KPI.

以上來看就知道單純就最高溫與最低溫就有很多種觀點, 而有沒有下雨就更麻煩了.

1. 最常見的就是下雨機率, 這個理論上是 0% 或 100% 機會最高的, 但實務上 0% 是偶而會見到, 100% 是不太可能出現, 因為這個還有時間與地區的因素考量.

2. 若比較模糊的預測就是寫 "晴時多雲偶陣雨" 這樣的描述時, 就只好去抓 "雨" 這個字, 或者是國外會寫 Shower, Rain 等等, 若甚麼都沒寫就只能當 0%, 若有寫到的話就當 100%.

3. 如同溫度一樣, 若一天有不同的預測, 就將這降雨機率平均, 這也是最痛苦的決定, 因為理論上也應該是最新的一次是最好的.

4. 更精確一點的預測, 應該就是預測當天的降雨時數 (Rain Hour), 這是較好的, 但這只有一家這樣寫, 所以最後只能是若降雨時數不為 0 時就是 100%, 不然就是 0%.

5. 比較準確的預測方式應該是預測雨量, 但這個雨量是跟下雨的時間有關, 因此像 Accurate Weather 就直接寫小雨雨量, 下雨雨量, 陣雨雨量, 雷雨雨量去區分, 就可以知道下雨的真實狀況.

降雨的機率跟溫度不一樣, 溫度大家都有, 降雨機率並不是每一家都有, 都是有各自的方式, 但若真的要設定 KPI 來作比較, 必須還是要有共同性, 這共同性就是一般化/Normalization, 但在一般化的過程必然會損失很多資料, 理論上是能避免就避免, 不能避免的話也只能趨近, 所以這兩個指標居然差了三個月才寫出來, 並不是程式很難, 而是要找到較好的方法真不容易阿.

而最近中央氣象局的網站有改版, 而改版後又多了不少資訊, 尤其是降雨的狀況的觀測真的是以區為單位了, 只是目前只是做記錄, 並沒有做預測, 因為現在中央氣象局是跑模式後再經過人的判斷修改做最後結果, 這個要到區鄉里鎮是不太可能有這人力的, 但此時若是靠 Data Mining 又可以有不同的觀點了, 改天來做 "你那邊再過 38 分鐘會下雨喔~~~" 這樣的系統.

事實上我們台灣的中央氣象局不是沒有在努力, 最近也做了一個可以更精確預測的劇烈天氣監測系統, 真的可以給予掌聲, 只是這個外包商不知道是民國前那一年成立的, 這系統不只是 Microsoft Windows IE Only, 並且是以 1024*768 的解析度為主, 還必須安裝程式才能跑, 只能說台灣政府離 Open Data 有點距離, 只是這題目一講就會講不完了. (此段為錯誤訊息)

2011年7月15日 星期五

神貘天氣: 下雨的預測準確率

上一篇講到我們國家的中央氣象局的預測準確率, 本來以為不會多好, 後來發現事實上還不會太糟, 甚至可以說是在 A 段班的, 而我一直沒寫下雨的準確率時, 認為這個應該大家都有 8 成到 9 成的準確率, 結果我錯了, 事實上有 6 成到 7 成的準確率而已.

這次的計算因為有點小麻煩, 因為有若是要計算溫度的話, 最簡單的就是用每日的最高跟最低溫做比較, 但每天降雨機率的預測本身就是一個在變動的數字, 每次預測都不太一樣, 但這個並沒有最高最低, 只有全有與全無 (有下雨與沒有下雨), 所以到底要如何去做 KPI 的準確率就讓我想了許久.

最後還是把每次的機率給平均起來, 做為當日的預測, 唯一的問題就是每一個單位預測的方式都不太一樣, 所以要先 Normalization, 而接下的計算就跟溫度的預測差不多了.

說起來溫度的預測是有很多解空間 (可能是 40*40) 的狀況, 但下雨與否的解空間好像只有 2, 也就是有跟沒有下雨, 因此預測起來應該很簡單才對, 且大家都說有下雨預測本來就應該有 8 成以上的準確率來看, 說起來感覺也沒那麼困難, 我本來也不太想把這個差別不大的預測當 KPI, 但現在算一遍後, 發現我錯了, 因為大家多數是在公布下雨機率的情形下, 解空間暴增為 100, 這預測變得沒那麼簡單了.

天氣穩定的話, 說要達到預測率 100% 是不難的 (畢竟解空間只有 2), 且控制在 8 成也是沒問題的, 但天氣一不穩定, 只要超過 3 天以前要預測有沒有下雨似乎比想像中的還要難, 事實上八成準確率指的是昨天預測明天, 但這個 KPI 若是延長到五到十天, 當然困難到就更高了, 下表就是現在檢驗的結果 Snapshot 快照:


而這張圖是取自今天 (7/15) 的 http://weather.datamining.tw/kpirain.php , 並不意外第一名可以是在 8 成以上, 但有時第一名卻不到 6 成, 當然平均起來至少有 5 成以上, 但也常常超過 5 成的誤差, 這代表這預測比猴子還糟糕.

只是目前來看, 我們國家的中央氣象局表現的比溫度的預測還要糟糕, 雖然有 6 成 5 的準確率, 但是排名第三名, 比 Weatherbug 以及對岸來得差, 這可能就有點須要檢討了.

而在完成下雨預測的 KPI 後, 加上溫度的 KPI 就完成檢核點的計算, 而進一步是能不能就這些預測做不同的 View, 也就是說我們可以不做天氣的預測, 畢竟這是專業的, 但我們可以利用資料探勘來計算誰的預測比較準, 這代表的是有沒有可能有更高的準確率呢? 請大家拭目以待吧.

2011年7月14日 星期四

我的 Mac 與 G700 的邂逅? 不, 死纏爛打.....

是我的朋友就知道, 某隻動物很常說: "滑鼠是除了你另一半外, 最常摸的東西, 不, 可能還要常...", 所以說, 找一隻好用與合用的滑鼠, 其重要性不輸給找對的另一半 (誤).......

雖然 "效率" 是句充滿 "罪惡" 的名詞, 但若因為有好的工具, 因此可以好好的工作 (或玩), 是件合理也不過的事, 在之前我已經有太多文章去 "推廣" 三螢幕, 或是 "六螢幕", 也講過幾篇 "左手鍵盤/雙滑鼠", 或是幫助你輸入的 "Gadget", 等等的東西, 但好像還沒寫過滑鼠的事, 但這不代表滑鼠不重要, 是太重要了.

在我開始用 Macbook Por 成為我工作的唯一的平台時, 一開始用的是 Logitech MX1000 與 M950 之類的大型桌上滑鼠, 但這真的很不方便攜帶, 因此不到一年就換了 Logitech VX Nano, 而這一用, 就用了兩三年, VX Nano 當然是當時為了 Notebook 做的滑鼠, 而 Logitech 對 Mac OS 都有比別人好的支援, 因此說要換成其他滑鼠的機會不高.

VX Nano 除了小外, 還有兩個多出來的功能鍵, 這個在 Mac 的使用上, 我都設成 Desktop (桌面) 及 All Application (顯示所有應用程式), 這樣的切換, 比 Task Bar 之類的快太多了, 且不用去移動滑鼠, 只是人是貪心的, 兩個不夠用往往想要的是更多的, 而當 G700 出來的時候, 說這個 13 鍵都可以定義時, 我就躍躍欲試, 但結果是 "Only Support God Damn Windows" 時, 就只好冷下來了, 期待那天 Logitech 羅技大發慈悲的出 Mac OSX Driver 再說.

當然一個滑鼠的好用, 須要用很多方面來討論:

0. 人體工學: 好握是很重要, 每一個人都不一樣, 要看手的大小及習慣來選擇.

1. 解析度: 解析度越高當然代表你能夠在最短的距離去你要的地方, 這對手的疲勞幫助相當大, 當我忘記帶滑鼠一換到別人的滑鼠時, 用一整天手都會很酸, 這個尤其在用多螢幕時會更明顯.

2. 按鍵: 有的滑鼠按鍵抄難按, 按到手酸都還沒按下去, 當然除了標準的兩三鍵外還有其他的鍵可以自設的話, 那就太棒了, 當然人一隻手指頭只有 5 隻, 太多還是會搞混的.

3. 反射能力: 從光學到雷射, 滑鼠的定位靠的是跟桌面的關係, 早期滑鼠是用滾輪, 但我想現在應該沒甚麼人在用了吧, 而雷射的波長比紅光更短, 雖然須要更高的運算速度才能解析, 但有能力解析的話不只解析度能增加, 也可以在更多桌面上使用, 現在還有可以在玻璃桌面上用的滑鼠.

4. 滾輪: 現在沒有人不用滾輪的滑鼠吧, 所以這邊要說的是滾輪的好壞, 尤其是好的滑鼠往往有無段跟有段的切換, 甚至驅動程式有加速能力, 都會讓滾輪變好用.

5. 定位能力(滑鼠墊): 這定位能力指的是準確度, 當然這個不只跟滑鼠有關, 滑鼠墊的因素也是相當重要, 有些人喜歡用照片或有圖案的滑鼠墊, 事實上透過不同的顏色與材質都會有些微不一樣的反射狀況, 一個好的滑鼠當然沒問題, 但不夠好的滑鼠就會有問題.

6. 滑鼠墊片: 滑鼠好滑很重要, 好滑就是在於與滑鼠墊與桌面接觸的那個地方, 通常會有個易滑動的墊片, 但這個用久了會磨損, 因此過一陣子就要換掉, 你可以去光華商場買, 這是很多人很常乎略的一環.

7. 無線: 這個最後講, 因為這個各有利弊, 像這隻 G700 就有雙模, 想要無限制時就拔掉線, 追求精確度時就插上線, 當然並不是每一隻都能這樣, 所以要好好想清楚你要的方向, 但通常除了打電動外 95% 都是選無線準沒錯.

N. 價位: 都已經說這個比選另一半還重要了, 你還在用不須要請小朋友出面的滑鼠嗎?

而在有一次, 以為我的 VX Nano 丟掉時, 我就再次尋找, 雖然官方還是不支援 Mac, 但已經有人說是可以用的, 利用其記憶設定的方式, 先去 Windows 設定再來 Mac 用時, 我這時候也終於有 Windows 的電腦了, 因此是有機會是可以一試的, 只是有兩個大問題, 一個是雖然說可以去 Windows 設定, 但 Windows 的功能鍵跟 Mac 是不一樣, 而對我最基本的 Desktop 與 All Application 不是普通的按鍵, Windows 不見得會有, 即使其他鍵可以設, 對我而言還是有跟沒有一樣, 但最後沒買的原因是一個更重要的原因: 只是這隻死老鼠躲進我包包的夾縫, 只是一時沒找到.

雖然後者的因素沒有了, 但前者的因素我還是要去了解, 因為真的有人說可以, 所以在發生 628 癮事件後, 我剛好有兩個理由真的去找那位朋友測試滑鼠兼問八卦了.

一開始時, 發現 Logitech Control Center 真的抓不到 G700, 所以我只好仔細研讀那篇文章, 他說有兩個方法:

1. 利用記憶設定先去 Windows 設定 (這個大家都知道)
2. 改用 SteerMouse Driver

事實上我在三四年前為了解決 M950 時, 也是使用 SteerMouse 的 Driver 來去辨試, 就立刻下載來用, 發現所有的鍵真的可以抓得到且能夠去自己設定, 更重要的是 Desktop 與 All Application 的 ShortCut 方式甚至比羅技官方寫的 Driver 更好設定, 因為以前為了要做到這件事, 是必須要把這功能 Bind (綁) 在功能鍵上, 然後去 Emulation, 而現在是完全不用, SteerMouse 一開始就可以直接選這樣的功能.

所以過了幾天, 我就下單了...

這篇就這樣完了嗎? 那樣這篇就是閃光文意味居多了, 我寫這篇除了要勸敗外, 是要跟大家討論你會如何設這些鍵?

我一開始是這樣設的:

1. 左上角有三個鍵: 依序是 Expose 的 Show Desktop 與 All Windows, 第三鍵是 Switch Application.
2. 姆指四鍵是: 空白, Enter, Firefox 與終端機, 因為空白可以翻頁, Enter 可以直接輸入, 而 Firefox 與終端機是我最常用的兩個應用程式.
3. 中鍵按下去是另開視窗, 也就是 Command Primary Click.
4. 中間在滾輪模式切換下面的那個鍵是 Move to Close Button.

我原本是這樣設的, 但後來才發現一個 SteerMouse 也可以支援不同應用程式有不同的設定, 此時我就設:

1. iTunes, 把 Firefox 與終端機那兩鍵變成下一首與上一首.
2. Firefox 模式時: Firefox 那鍵變成上一頁.
3. Terminal 模式時: Terminal 變成 Copy.

我一直很納悶工作的須求市場應該比遊戲市場大很多, 且一個好的輸出入設備對工作效率影響很大, 但為甚麼沒有多少上班族知道這重要性, 更廠商也沒有去針對這方向去開發中高階市場, 最後變成電玩或電競的設備變成是較好的選擇, 我相信若能夠針對這樣市場去開發應該很有潛力阿....

2011年7月11日 星期一

Google+ 的圈圈及以外的六項武器

"若有一個像噗浪一樣好用的系統, 但有小圈圈的功能, 我二話不說一定會跳過去..."---- GH404X, 2009 (噗浪第一年)

在 Google+ 襲捲台灣不到兩個星期, 噗浪在 Alexa 跌了一名, Twitter 留言銳減, Facebook 有沒有受影響? 沒有人說得出定論, 但已經出現不知道多少有趣的圖來說 Google+ 如何掌 FB 一巴掌了, 所以要我來做個有趣的預測的話, 我會說:

1. 噗浪既有的人口有一半會被 G+ 帶走, 因為噗浪的好操作以及實用性在某方面是無法取代, 對於不依賴資訊的人是足夠使用的, 加上還是有新人進來, 只是未來的高峰應該只有現在的 70% 而已.

2. 由於 Google 使用者將會有 9 成轉成用 G+, 其中台灣與 Twitter 的使用者族群重疊, 因此 Twitter 在台灣未來可能連現在的 3 成都不會到, 畢竟 G+ 是給資訊缺乏症者很好的藥, 給傳教士有很好的管道, 給公關與媒體業的人制定圈圈極好的工具, 可能在台灣受影響最大的是 Twitter 了.

3. Facebook 會不會影響這麼大是很有趣的問題, 雖然說 9 成使用 Google 的用互會放棄 FB 轉到 G+, 但 Google 的用戶並從廣義到狹義是 2 成到 4 成之間, 尤其是那些 Yahoo 的使用者不太可能因此轉移, 因此接下來的問題不是 Google Plus 的挑戰而已, 而是 Google 在台灣的挑戰, 因此 FB 在台灣的成長空間不只是是要面對全球 FB 滑落的問題了.

4. 部落格的影響可能在 Plurk 或 Facebook 的成長時已經打擊過了或使用者轉移過一次了, 而現在的問題不是 G+ 的功能, 而是未來的功能, 若增加與其他社群的結合時, 反而對 Blogger (現在已經叫 Google Blog) 不是壞事, 相較前面幾種微網誌, 部落格可能是影響較小的.

但這篇文章不是想寫台灣在 Google+ 出現之後對 SNS 的影響, 而是未來的幾個關注重點:

1. Toolbar: 10 個人有 9 個人說 G+ 最大的 Killer Function 不是在於他的自己的功能, 而是 Google 這隻大雞可以帶小雞的能力, 其中若是所有的 Google 的服務都有 G+ 的 Toolbar Button, 以後幾乎沒有人不會在用 Google 時順便使用 G+了, 尤其是 "分享" 是種會擴散的東西, 這在未來是相當重要的一個因素.

2. Search Engine (+1): 由於 Google 有搜尋引擎的優勢, 因此這個 +1 很快的就放在搜尋結果頁了, 再加上相關服務, 在未來可能 +1 會無所不在, 在上跟上面 Toolbar 的相輔相乘, SNS 須要的就是足夠的內容與服務, 這個對 Google 而言跟本不算甚麼.

3. Android: Facebook 與 Twitter 最大的問題是沒有 Device, 但 Google 有 Android, 我們都知道原生機器的優勢, 未來 Android 與 Google+ 的結合, 無論是訊息, 視訊, 相片, 定位 (LBS), SNS, 若是在每個 Android 都是內建 G+, 那誰要用 FB 阿? 話說我還沒有 Android 手機, 有錢一定要買一隻.

4. OpenSocial/FriendsConnect: 若是 Google 可以有 FaceBook Markup Language 那樣的 Container (容器), 此時 Google+ 是很好的 Platform 了, 加上跟既有的 OpenSocial/FriendsConnect 結合, G+ 可以在 Blogger/Google Blog 遍地開花, FB 也不得不更開放 FBML 了.

5. API: Google 的透通性 Transparent 是眾所知道是最強的武器, 雖然到現在沒有真的公開其 API, 但可以相信會相當有趣的, 很多 Developer 開發者已經躍躍欲試了, 當然 G+ 的樣式在未來應該會比 Facebook 更開放, API 應該也無庸至疑的.

6. Gtalk: 在之前, gtalk 並沒有較好的圈圈與分類的功能, 但在有 G+ 的視訊聚會功能, 基本上就像是一個很自然的聊天室, 尤其這個跟 Andriod 與 Gmail 的結合, 我已經準備買一台 Android 手機了.

上面說的六項重點, 說是 Google+ 的六項武器也不為過, 但真正紮實的攻擊力就是圈圈, 目前就 Google+ 來看有下面幾種圈圈的可能性:

1. 社交圈以及分類: 任何訊息可以設定圈圈閱讀, 這個分類可以做任何組合, 目前圈圈的發布是很彈性, 但閱讀還無法做組合, 例如只讀幾個圈圈的訊息是沒有的功能.

2. 延伸圈圈: 目前延伸圈圈設定為有加你為圈圈但你沒去圈他的人, 所以這訊息算是半公開的, 但在實務上還是有特定對像, 這對於某些隱私有很不錯的幫助.

3. 被管理的圈圈: 粉絲團或社團在 Google+ 可以很輕易的用外部控制的圈圈來做到, 包含開放加入或管理者申請加入的, 這個在於用在共同協作平台或工作及 "組織" 有很不錯的幫助, 就像是加好友或圈圈, 若是社團屬性的話, 只要一加入這個圈圈, 就不用當新人一加入後每一個人都要加入了.

4. 組織化的圈圈: 目前這些圈圈並沒有子集合或母集合的觀點, 若是有這樣的組合的話, 圈圈的管理會更方便, 你只要做其繼承, 很多連結(圈入)只要設定一次就可以出現在其母圈圈, 就像是公司與部門, 甚至是管理者的小集團.

當然目前 Google+ 的圈圈還沒有組合, 管理, 外部, 但若能做到這樣, 圈圈的管理會更人性, 但相對的會更複雜, 但這些都是 Option, 不是必要, 但之中取捨的拿捏蠻不簡單的.

但說到這樣, 似乎代表 Google 的戰略面真的很厲害嗎? 但事實上再好的戰略也要有足夠的資源去支持, 沒有以前的努力, 怎會有現在的資源呢? 這也是大G 帶小g+ 的真締阿?

註:圖是紅色死神幫我畫的, 特此致銘感謝.. 跪泣...

User Behavior Feedback to Content 使用者行為回饋內容系統 (I) 前置與前言

網站的經營最有趣的地方不是在於網站的內容而已, 而是如何跟使用者互動, 這跟其他非互動媒體 (雜誌, 報紙, 等等) 不一樣的地方, 至少在時效性是完全不一樣的...

大家都知道, 這個互動包含 UGC (User Generated Contents) 以及最單純的網站觀察所帶來的經營參考, 當然這個對每一種網站都有不同的方向與重要性, 無論是電子商務網站, 討論區網站, 活動展示網站都會有不同的考量.

只是大家都知道使用者導引是很重要 UI (User Interface) 的一環, 當然這個利用在圖書館定位是種參考服務, 早期這種東西都是用人來操作, 這是最人性的方式, 但事實上在成千上萬的使用者網站來看, 這種 "Guide" 導引服務是不可行的, 一定要用機制來完成, 這種機制有三種方向:

1. 使用者自己的行為
2. 其他使用者的行為
3. 使用者自己對應在其他使用者的行為

說到第一項大家都知道就是在你去看拍賣網站或電子商務網站中的 "你瀏灠過", 或者是在討論區網站的 "你回應/發表過", .... 等等的項目, 因為人的行為若在網站上有互動, 其行為是某種收歛的, 因此從過去的行為就可以做為未來行為的導引是無庸至疑的.

第二項是其他使用者的行為, 最常見的是排行榜之類的資訊, 因為即使每一個人的行為再怎麼不一樣, 都有其共通性, 所以大家的共同行為是很好的導引. 但除了無聊的排行榜外, Data Mining 提供了對單品/單文章做進一步的共同購買, 關聯閱讀是最常見也最直覺的方式, 當然這個的計算是比排行榜須要更多的資訊與資源才行.

最後一項是若我們也搜集足夠的資訊, 無論是對整體, 族群或個人, 就應該可以進一步對一個人做建議與導引, 這個在 Facebook 的好友建議已經有不錯的展現, 只是這個若能更加入一些回饋就好了.

但我寫這篇不是要講上面這三點, 因為這三點這樣的邏輯是誰都可以推論出來, 只是要如何做呢?

我們都知道, 經營一個網站要從使用者給導引, 但這個導引必須要從這些 Raw Data 找出共通性, 若沒有了共通性, 任何一個點擊, 任何一個網頁瀏灠都是獨立的, 若沒有共通性來指引, 就無法歸納出經驗以及可行性來做協助.

當然資料本身很難有共通性/共同性, 往往須要人的協助以及人的定義, 例如一個點擊沒有意義, 但我們可以把一個網頁切割成很多區塊, 從區塊的 click through 來跨時間以及跨類別之類的定義後, 就可以讓使用者使用資訊變得更精確.

因此若我們經營網站有個 KPI 的目標, 無論是消費, 貼文章, 等等的最終端行為一定會有很多的過程, 記錄這些過程不只用來我們做為結果因子分析很有幫助, 更者這些過程若能做為其他的使用者做導引, 更容易導到我們最想要的 "終端行為", 所以這些行為不能只是做為分析用, 更可以內容使用, 而有那些行為應該記錄呢?

1. 使用者是因為那個網站來的?
2. 使用者是因為那個關鍵字來的?
3. 使用者在網站內部最近是搜尋那個關鍵字?
4. 使用者是因為那個活動進來的? 或者是終端行為最後一個活動是那個?
5. 使用者最近點過那個首頁區塊? 或者是第一個首頁區塊?

當然還是有很多行為是該記錄的, 無論這個終端行為是 "下標", "下單", "發文" 等等, 因為網站的屬性多少都有不一樣的狀況要記錄, 而把這些資訊足夠被記錄到 Cookie 的時候, 當終端行為發生時, 就可以對這些行為做回饋, 那怎麼回饋呢? 就下回分解...

備註: 原圖取自 http://www.erinlynnyoung.com/244/user-testing-fallacies/ , 不知有多少網站真的做過 User Testing?

2011年5月24日 星期二

難道中央氣象局都不準嗎!?

在寫這 "神貘天氣" 系統的時候, 並沒有去假設我們中央氣象局的準確與否, 倒是真的以一個較為開放的方式去定義 KPI, 並沒有刻意或有意的去證明我們台灣中央氣象局的好與壞, 因此在當時寫出來發現中央氣象局相當不準的時候, 相當驚訝, 而在記者報導的時候, 我們才發現資料有問題, 所以才會很 "厚臉皮" 的請報社拉下這篇報導, 而現在經過一個月了, 數字已經正確了, 所以可以回頭來看中央氣象局到底準不準.

從四月21日到現在已經有 34 天了, 在 6 個資料源的比較下, 若是以每日最高準確率來看:

Acculate Weather: 11 天
Weather Bug: 9 天
The Weather Channel: 6 天
中國中央氣象台: 4 天
台灣中央氣象局: 4 天
***Mask***: 1 天


原始資料在這邊, 用這個圖表來說, 我們的中央氣象局好像很糟糕, 但用我們實際 KPI 的定義跑出來看, 卻是下面這張表:

除了 30 天以及這週, 不是中央氣象局第一名(上個月因為有包含到 4/21 之前的錯誤資料我們忽略), 甚至迄今的第一名也是中央氣象局是最準確的, 為甚麼會有這現像呢?

仔細看每日戰積, 雖然中央氣象局第一名的次數很少, 但在前三名的機會到高達 65% (22/34), 也就是說有一半以上的機會都在前段班, 甚至最後一名的次數只有一次, 或者是以 KPI 的量級來看, 中央氣象局雖然不是最準確的, 但大部份的時間都誤差不大, 因此在平均的結果, 幾乎都能夠拿到第一名的原因.

所以若是要問我對中央氣象局的觀點是甚麼: 中央氣象局雖然不是最準的, 卻是不會最不準的.

目前的 KPI 只有溫度的準確度, 而接下來會計算我們最關心的下雨準確度, 甚至是兩個加起來的綜合指標, 這會不會造成結果的不一樣, 讓我們拭目以待.

2011年4月15日 星期五

神貘天氣都不準


Weather.DataMining.Tw 做了一個多月了, 這代表資料也搜集一個多月了, 已經幾乎到可以發表的狀況了, 且有個記者朋友也真的寫了篇採訪稿, 但他跟我們講中央氣象局的人說我們的資料有問題, 我一面岔意一面檢查, 果然資料真的有問題.

雖然在這種抓資料的程式, 最麻煩的是要處理很多例外以及抓不到的狀況, 所以做了很多檢查點, 應該是經驗已經很夠了才對, 但這次很意外的是在最後寫入資料庫時, 因為是 Copy & Paste 的關係, 不小心把之前沒有用的程式碼給複製了, 造成正確的資料被覆蓋了, 寫入的當然是不正確的資料, 而這影響的部份是中央氣象局在預測一周的天氣時會發生的.

因此若要真正正確的資料, 要過一週後才會是新的資料, 也就是在 13 號修正後到 20 日之後才是真正正確的 資料, ...

除了既有上次的 KPI 外, 也寫了個逐日戰積, 大家可以知道每天的比較表...

因此在 KPI 有個迄今, 到時會從 4/20 開始計算, 原本是 3/19, 因此晚了一整個月, 所以我之前真的錯怪中央氣象局了, 雖然我知道我是公正去評斷, 但若搜集資料錯誤的話, 就等同 Garbage In Garbage Out (GIGO), 這是很大的錯誤.

有人看到我寫 "台灣天氣網", 以為我抓的是另一個民間單位, 事實上這資料都是取自 "iTenki" 的 "天氣風險管理開發", 所以也在新的網站做修正.

明眼的人一看就知道有套新的版型, 這是由 "紅色死神" 做的, 但我還沒套完, 等套完之後應該會給大家驚豔, 畢竟這個是 "神貘天氣", 指的是我們兩個開始初期開發的網站...

所以要等到真正有價值的資料, 可能要等到 5 月, 請大家再多等待一陣子吧, 真不好意思.

2011年3月25日 星期五

甚麼天氣的圖阿?

我也知道圖在 What's the Weather Web 神貘天氣是很重要的, 所以要畫圖也要有圖解阿, 只是說實在的, 深入淺出是我最不善長的一環阿, 本想請人幫忙寫的, 但還是自己跳出來寫好了...

上圖是取自於 3/23 在 Weather Channel 對 台北 的天氣預報, 而 Weather Channel 是在當天就不會再預報一次的天氣, 而是在 9 天前就開始預報天氣, 所以在 X 軸雖只看到 -8, -6, -4, -2, 但事實上前後還有個 -9 與 -1, 指的是在 3/23 的幾天前的預報...

很明鮮的在 3/23 的前 9 天也是 3/14 對 3/23 預報是 13~15 度, 依序下去每天都有對 3/23 有預報, 所以紅色是預報的最高溫, 藍色是預報的最低溫.

綠色是在 3/23 我們實際測得的溫度是 13~15 度, 而整體而言都算很準吧, 因此我們要看誤差的話, 應該是看紅色線跟綠色上端的面積和與藍色線與綠色下端的面積合, 而在這個圖就是很明顯的高於綠色到紅色的面積與低於綠色到藍色的面積就是誤差.


而這張圖是當天中央氣象局的預測, 而中央氣象局是在 7 天前才開始發布那天的預測, 而到當天也會持續發布當天的預測, 而這邊來看, 藍色線都比綠色還要高或一樣, 所以低溫的誤差是藍色到綠色底的面積總合, 而高溫的誤差有一天是較低的, 但在面積來看還是可以把三塊面積加總, 但所謂三塊面積加總事實上也是每一天的最高溫預測與實際最高溫的差總合, 當這兩個總合加起來就是總誤差, 若跟上圖來看可以看得出來誤差相當的大.

因為每一個單位預報的週期都不太一樣, 因此我們會依天數做平均, 只是這個平均不是都維持每天不變, 而是依天數的差距乘上等比級數 0.9, 這個也是說, 越早預測的比重也越低, 也是說若我們認為預測明天的天氣是 90% 的話, 昨天預測明天天氣則是 81%, 前天則是 73%, 依續下去, 而明天當天的預測比重則是 100%, 因為若是當天預測當天還有誤差, 這當然是最糟糕的囉.

2011年3月22日 星期二

神貘天氣哇 What's the Weather Web 公測


在 3/21 大概完成了一個初步的心願, 這是從莫拉克之後, 雖說一直想去中央氣象局看能不能做點甚麼貢獻, 但說真的, 我須要學習的東西還很多, 因此只好先自己做吧.

資料探 勘的假借法? (Data Mining)文章說到, 有時我們無法取得第一手資料, 但我們可以嘗試用有系統, 可以自動化, 較為客觀的第二手資料做 "加工", 獲得要的答案, 就像是我們無法取得台北市交通狀況, 但從網路上公車的行車記錄幾乎就可以算得出來台北交通狀況, 用這個當 KPI 是再真確不過了.

因此若要了解天氣預測的準確與否, 最簡單的就是比較預測與真實的關係, 所以這計劃就產生了前題, 而接下來就是從這二手資料中, 是否可以純用數學模型算出一個比這些天氣預測系統取得更準確的 KPI 呢?

花了 10 天, 終於把這個 Weather DataMining 做個了斷, 嗯, 是基本的雛型, 也就是先定義出預測準確率的 KPI, 這公式很單純就是:

1. 從今天, 昨天, 前天一直到有預測今天氣候的資料做記錄, 跟實際今天的溫度做比對, 最簡單的就是取面積 (積分這差距).

2. 距離越遠的日子, 準確率應該也越低, 所以採取個等比比重做為調整, 且每一個單位並不是擁有相同的預測天數, 所以也要 Normalization (正規化), 目前每早一天, 就比前一天少 10%.

3. 最近這三天的預測應該是要最準確的, 所以我們特別做了個加權, 因為也不是每一個單位都有針對 "今天" 做預測.

最後就以上述的公式定義出溫度預測準確度的 KPI 了.

Weather DataMining 氣象探勘這篇文章提到, 是否預測穩定度跟準確率相關, 所以我們接下來定義穩定度是甚麼? 穩定代表一定有變化的差距, 目前有幾種可能定義:

1. 當天跟(前一天以前的平均)差距.

2. 當天跟前一天的差距.

3. 當天與前一天的差距以及更之前差距的等比累積再正規化.

而會先試算看看才知道那個較為準確, 說不定實務上又會做綜合指標, 而若能找出穩定度, 又能找出穩定度與準確率的關係, 此時新的預測模型就會出來了.

這個網站最早是我跟紅色死神開始規劃的, 因此想說以我們兩個人的名字命名, 本來最初是想說來個 "紅黑大對抗", 或者是 "SunDog/紅獸" 這樣的想法, 但在偶然之間取最後兩個字, 跟 "什麼" 有相當的諧因, 所以就變成 "神貘天氣", 而最後是想說加個驚歎語, 而原本是叫 "阿", 後來改 "呀", 最後為了配合跟 "WWW" 致敬, 所以就變成 "哇" 了, 因此目前公測的名稱是 "What's the Weather Web (WWW)".

有不少朋友說願意一起來幫忙, 包含如何 Deploy 到 ipad/iphone, 現在已經有個雛型了, 所以準備開始好好的玩了, 我最近就會敲大家了.

(圖例就是網站的圖, 可以看出從當天以前之前每天對溫度預測的變化, 若是當天已經是發生了, 就會有綠色範圍指示真實溫度, 因此可以輕易看出準確率, 而網站網址為 http://weather.datamining.tw 神貘天氣哇)

2011年3月19日 星期六

從歷史圖型來看數字預測

在系統調校的一開始, 我一定會問大家一個問題: "系統負荷 60% 是過高還是過低呢? 系統負荷 6% 是過高還是過低呢?" 當然這個 "過高過低" 指的是一種不正常的現像, 而在之前要有一個前提: "何謂不正常?", 所以就要知道這系統的歷史記錄, 一台機器平常都是 80% 在跑, 現在只有 60% 負荷, 表示有甚麼工作沒在動了, 而若是平常一台機器負荷還不到 1%, 現在跑到 6%, 一定發生甚麼問題.

因此, 歷史資料對於我們的判斷是相當重要的, 尤其在很多可以量化的時間序列來看, 要搜集與儲存這些資料是相當重要的, 但接下來的就是要去判斷, 因為這判斷未來所須要的資訊就是來自於過去, 加上自己的想像與經驗(模型), 這在資料探勘中, 就是屬於資料搜集, 資料清理對接下來的資料探勘的重要性.

但在之前, 到底怎樣的判斷 (探勘) 是對或錯呢? 我常常說, 資料探勘所知道的可能是大家早就已經知道的東西, 只是要在短時間內從這麼大量的資訊做出大量的決策是人做不到的, 即使這事可能是由人來做是最好的, 所以電腦只是來輔助人的判斷, 而在真的去 "處理/探勘" 之前, 最直接的方法就是: "Data Presentation/資料呈現".

說到這些數字與資料的呈現, 最常用的是表格與圖型, 但說到要能夠直覺的一目了然, 還是要從圖型來看, 因此我常會要求用 MRTG 或 RRDTools 來做出一個基本的圖, 因為這是輔助判斷的最好方式.


我常會說, 人眼與心智是最好的判斷系統, 就像上一張圖, 這是一個歷史資料圖, 若我們知道當上面的線圖接近到 100 時系統就會有問題, 那看了這張圖, 你認為合理的狀況這三五天內會不會出問題呢? 若是用電腦的模型來看至少有兩種方式:

1. 迴歸: 就上圖一算, 數字的變化是往下降的, 說不定過不久是 0. (黃色線)
2. 平均: 目前剛好是平均, 所以應該沒甚麼大變化. (藍色線)

但我們人眼一看就知道, 趨勢不是紅線就是淺藍的線, 不應該是黃色或藍色, 若是淺藍的話, 大約 5 天就會出問題, 若是要樂觀一點來看, 紅色會出問題的日期還要 10 幾天, 所以還有更多的時間, 但出問題是必然, 只是若用上面兩個常用的模型來預測, 往往會失準, 但相較之下畫出圖後用人來看反倒是最準的.

在上一篇的 "氣象資料探勘" 的文章中, 收集資料後, 當然就是要做進一步的分析與預測, 但新的模型與方法找出來至少要一段時間, 因此在之前想要讓大家知道誰預測比較準確, 最簡單的方式就是畫出圖來, 這就是明天各家氣象預測的歷史軌跡圖:



這張圖可以看得出來除了 The Weather Channel 在高溫在今天有下修外 (大概是昨天上修太多了) , 大家都是維持往上修正, 所以當大家看到各家的天氣預測, 應該心裏有個底, 就這個趨勢來看溫度不太會比預期得還要低才對, 當然這也是除了預測外, 若能知道 "預測的歷史趨勢變化" , 在對於這種有 "時間性" 的預測往往會有更準確的感覺, 這也是有趣的地方.

當然這只是一個示範, 而這計劃目前暫時定名 "神貘天氣呀", 這說是 "甚麼天氣呀" 更應該是說我跟 "紅色死神" 一個小小合作發想的作品, 除了希望做出更個人化, 更人性的預測外, 也打算做 iphone/ipad 的 app 來讓大家玩, 所以有甚麼建議請大家多跟我或死神說.

2011年3月9日 星期三

Weather DataMining 氣象探勘


在渾沌理論出來之前, 即使已經過了所謂科學終結的時代, 那時社會的氛圍還是在想說只要有足夠的資料, 就可以 "模擬(Simulation)" 出氣候給予預測了, 但是一隻蝴蝶(誤)把這想法給粉碎了, 但不代表說模擬計算不重要, 只是沒那麼 "絕對" 罷了, 因此在我小時候, 台灣最快的電腦不是在國家高速網路中心, 而是在氣象局.

無論是 Simulation 或 Emulation, 我們知道在計算在氣象可用的模型是相當多的, 甚至有很多歷史資訊可以參考, 但套句 Data Mining Forecast 兩大定律: 天底下無新鮮事, 天底下沒有相同的事, 再怎麼計算也只是種猜測與推估, 只是眾多可能性之一, 但到底除了這個之外, 還有沒有其他候選答案, 也就是 Minority Report, 這個可能在現實上要大眾了解是須要再教育的, 只是預測的單位不只一個, 無論是中央氣象局, 中央氣象台, 還有國外許許多多的單位都在做預測.

當然這些都是不同的看法與觀點, 甚至因為適用性不同, 預報方式也有不同的角度, 但到底那個是最準確的呢? 基本上有了 iPad 後, 我就很習慣的多看幾家, 除了 Weather Chanel 外, Accure Weather 也是不錯的參考, 只是最後就實務上檢驗那個是最準的呢? 看樣子並沒有這樣的資訊, 因此我就想若是氣象預測的準確率是可以成為 KPI 的話, 到底誰能夠拔得頭幬呢?

事實上說要知道誰最準 , 就實際面應該是我們也是想要從中知道最準的答案吧, 甚至若是不準的話, 會往那邊偏差呢? 若心裏有個底的話, 也是相當不錯吧, 因此這個 Weather DataMining 的小計劃就慢慢在腦子形成了.

在還沒有公布答案之前, 事實上所有單位都會對某天做很多次的預測, 從兩週前, 到一週內, 到三天內或是在明天, 每次的預測都不盡相同, 當然我們知道時間距離越遠, 變因越多, 誤差會更高, 但若能夠掌握好的模型與變因, 理論上很快就可以在幾天前就收斂, 但實務上是即使說要預測 2 小時後的天氣都很困難了, 更何況是在兩天前, 我想除了 Nami 娜美外應該沒有多少人有這能力.

有了準確率的 KPI, 更可以用收斂穩定度做另一種輔助參考, 理論上預測穩定度跟準確率有相對的關係, 因為若是用最 "真確" 的方法去預測, 穩定度是 100%, 當然準確率也是 100%, 但這是不太可能的, 因此在沒有準確率公布答案之前, 是否可以用穩定度來做考前猜題, 倒也不失個好方法.

這計劃最主要是要滿足我對數字與預測的惡趣味外, 也希望用這個小計劃好好的自己踢一下, 不然我之前所提的計劃都太大了, 當然也真的做出自己以及大家想用的東西, 有意義的東西, 放在 ipad 用自己希望的 UI 來看, 而最後也是要慢慢朝向我莫拉克後, 想說對台灣氣象有些幫助的自我期許.

有誰還有對這計劃有興趣嗎? 來找我報名吧!

資料探勘的假借法? (Data Mining)

前幾天有一個很重要的事, 就是 M$ 自己做了一個 IE6 Countdoown 的網站, 希望在 2014 年能夠讓 IE6 從地球上消失, 但我這篇不是在寫 IE6, 雖然我是網站開發者, 只是我只處理到資料庫端而已, 所以我並沒有那麼痛恨 IE6, 所以當看完這網站我並沒有很大的想法.

但仔細看了一下這網站的數字, 這網站的資料是取自網路界鼎鼎有名的 Net Applications .com, 很多網路分析資料的數字都是取自於這間公司, 所以也沒甚麼好意外的, 而在一個噗浪的討論串中, 有人說了一句話: 亞洲好像是最慘的, 仔細一看, 亞洲說不定占了整個 IE6 的三分之二, 當然其中有一半要歸功於中國大陸.

討論到這邊, 台灣的狀況也沒好到那邊, 最後大家七嘴八舌的說台灣真正的問題不在民間, 而是在公家機關, 此時就講到這些政府單位的固步自封, 食古不化, 甚至到貪污腐敗的程度, 所以認真看了一下:

中國 34.5%
南韓 24.8%
印度 12.3%
台灣 10.7%
日本 10.3%
越南 10.0%
香港 7.6%
若不說這是 IE6 的占有率, 而是說公家機關的 "官僚度", 甚至說是 "資訊暢通率" 說不定有許多人會相信與認同.

事實上在任何數字背後都有其意義的, 這也是我常說的 "Nothing Comes From Nothing", 事出必有因, 很多事情無法確切的知道, 或者是量化的得到, 若是用另一個管道取得不同的資訊, 說不定真的可以參照.

而在這份數字中, 表現最好的是挪威與芬蘭都不到 1%, 這更似乎可以證明些甚麼的感覺, 但 IE6 的占有率應該是用兩個因子來造成的.

1. 資訊的利用率
2. 資訊的進化率

也就是說, 若都沒在用網路, 當然也不會有 IE6 的問題, 但若只知道使用網路, 而不知道去進化, 去更新, 這才是最糟糕的事, 我們很清楚的知道台灣的公家機關是如此, 但事實上也是人民, 廠商放任如此的結果, 也可以說這是社會的氛圍也不為過, 畢竟政府是我們選的, 我們建構的, 而從這邊倒是真的可以看清一些事情.

說到這邊, 大家應該會懷疑我的標題應該是 "從 IE6 來看台灣政治的困境" 這樣才對, 這也沒錯, 事實上我最近在玩一些數字的時候, 常常會面臨到一些問題, 雖然我們期望在資料探勘可以用較為 "平面" 的角度去抓取資料, 但事實上任何動作與行為都有出發點, 要能夠去避免偏見是不太可行, 只是這些也不是問題, 真正的問題是: "抓不到", 以及 "無法定義"...

尤其有些數字是人去填的, 就像是這次馬政府認定政見完成率有 88% 那樣, 說這是公正客觀的指標還不如說這是個話術比較實際, 因此有時候我們該去取樣的數字應該是更沒有立場的, 甚至是更大量的, 更即時的, 尤其若是用 "系統性", "自動化", "架構性" 的去抓這些數字, 能夠呈現的資料往往會超乎我們的想像.

例如我曾用噗浪去搜集過 "失眠", "感冒", "翻桌", "好熱", "下雨" 等等情緒性或較直接的現像的字詞計算來看社會, 有些是有點廢話, 當溫度交替時就會較多人感冒, 而我倒是想說若進一步的去搜集 "找工作", "失業", 說不定也可以呈現出社會的不同面與角度.

當然數字只是非常非常的表面, 不能用數字的表相來去看, 更應該像是統計去探索裏面的因子去做分析, 但這個倒不見的是 Data Mining 可以做的事, 畢竟有時我覺得資料探勘跟統計有點像 天文 vs 物理, 一個是你只能從觀察去找到答案, 另一個是可以去做實驗與驗証, 有時從這角度來看社會, 還覺得這個社會雖然說是個母體 (Matrix), 但說要去架構還真的不可能阿, 這也是人類有趣的地方.

下面是原噗的內容.

熱門文章