2011年7月29日 星期五

悠遊卡踩 6000 次了....


昨天終於悠遊卡踩到 6000 次了..

6000 次 2011/07/28 (1 年 1 個月又 10 天)
5000 次 2010/06/18 (1 年 6 個月又 27 天)
4000 次 2008/11/20 (1 年 8 個月又 13 天)
3000 次 2007/03/07

為了記錄通勤的活動, 刻意把消費的悠遊卡分開, 所以現在身上都會帶兩張悠遊卡, 只是也發生幾次通勤忘了帶卡改用這另一張國泰世華的卡, 不然應該會早個幾天, ...

只是前 500 次幾乎是花不到 4 個月就達成, 因為那一陣子到處跑, 以為這次一該不到一年就會超過一千次了, 但結果還是超過 1 年, 但也是較快的一次.

像這張卡, 就純脆只在店家消費, 本來以為應該會有很多次, 但我剛看了才 128 次, 當然是因為沒計算 7-11 的 icash, 我還用壞一張 icash 說, 在想有沒有可能將那張卡的資料給倒出來, 不然很可惜說.

2011年7月19日 星期二

家中第二螢幕該如何買的選購指南 (上? 應該不會有下)

大家已經看煩我寫一堆三螢幕, 四螢幕, 五螢幕, 甚至六螢幕的文章, 因為大部份的人都都一句話給我: 我書桌座位沒這麼大啦, ..... 當然我就會說: 換個房子吧.... 接著我就被打了....

當然說要因為要多螢幕要換桌子, 換房間, 換房子, 換工作, 換生活, 這樣的思維有點本末倒置, 所以我也只能苦笑, 但說起來有時因為我提出更高的要求, 就是你到伯朗咖啡工作, 還是可以用雙螢幕與三螢幕的須求, 這議題我好像也寫過了, (但可能是寫在 Plurk) 或是放在 Flickr 的照片, 而我也花了不少錢與時間在找這答案上面, 雖然現在也不算找到, 但也是有某種 Solution 了.

而上圖是某日本推友的照片, 通常這個理論上只會在劍魚這種電影才看得到, 不然就是做 NOC (Network Operation Center 或看盤才會用得到, 而我看過最合理的使用方式就是 "草泥馬" 的工作平台是最合理的吧.
而下圖右邊是我在舊家的工作環境, 而我一到公司上班, 就只能用下面左邊這種方式了.

但因為最近 "家庭的關係", 我現在住的地方是一個共用的小桌子, 但對於用慣多螢幕的我, 如何去平衡多螢幕的須求, 但也能夠平衡家庭的須求, 也變成我要思索的問題, 而有那些問題呢?

1. 不能太大: 雖然螢幕是越大越好, 但就大螢幕對視線影響很大, 所以一定是 20 吋上下是極限吧.

2. 最好可以收合: 畢竟這是公用的空間, 那個螢幕一直放在那邊也是很占空間, 若是能夠方便的移動與收合是不錯吧.

3. 多功能: 若是這個不只是螢幕, 也是電視, 又能 skype 或 MSN, 這樣就不會覺得過於大而無當吧?

4. 攜帶: 若能夠也當其他用途的螢幕也是更棒了.
5. 顏色: 因為我家目前是白色系為主, 若是放個黑色的螢幕會很怪很怪.

有上述這幾點目標後, 接下來就是到處去找了, 而我第一個去想的就是收合問題, 而能夠收合的話, 我直接想到的就機架用的螢幕了(下圖), 這是不錯的選擇, 平常不用的話可以收起來當桌面, 只是顏色不太對, 甚至我在想要不要做一個像 Apple 螢幕的那樣 90度的角架, 但可以旋轉的話就太棒了.


但說要去開模做這樣的螢幕腳架是可以想想, 但真的要去做依我的個性不太可能, 我又不是鍵神, 所以想到的還是走 Portable LCD 的方向吧, 而之前的 Samsuang 與 Plus One 的經驗都不是很好, 而現在 Toshiba 出了個 14 吋的, 此時我眼睛就開了, ....
這個是一個只吃 USB 電源的雙螢幕, 但我知道 DisplayLink 對 Mac 的支援目前還是半調子, 且這款還沒進到台灣, 所以也只能想想就好.

只是在這次尋找的經驗中, 我就開始在想所謂的 Internet TV / Smart TV 的可能性, 此時就找到 Sony 這款 KDL-22EX420, 這款不只是背面是白色的, 又可以當電視使用, 不只做為第二外接螢幕, 也可以當第二電視, 且又能夠獨立使用當 Internet TV, 說真的我還真的差點下單了, 只因為他的解析度只有 1366*768, 所以最後還是沒有買.

我會寫這篇, 應該是上集, 因為還沒有真的去實現, 所以現在還在徵求意見與尋找中, 也把我目前的訊息給大家分享.

說真的, 在尋找的過程中, 還有一個讓我心動的 "Protable LCD"... 就是像下面的圖說:阿, 不要打我... 這才是極致阿...

Weather Mining, 到底有沒有下雨呢? 神貘天氣呀~~

(這篇是寫給在氣象局任職的某噗友看的, 若對這議題沒興趣的人可以跳過)

目前神貘天氣取樣了六個單位的預測, 希望以後還會更多, 但事實上要去 "Normalization/統整" 這些預報是相當不容易的, 所以一開始就是抓 Raw Data/原始資料.

一開始就做的溫度 KPI 是較簡單的, 就是預測當天最高溫與最低溫, 但這麼簡單的預測就有幾種變化:

1. 最高溫最低溫若是在預測多次不一樣的話, 就取最高值與最低值來計算.

2. 中國氣象台是把最高溫設為白天的溫度, 最低溫設晚上的溫度, 而晚上白天並沒有各自的最高溫與最低溫.

3. 比較好的預測是以小時為單位, 而不是以每天為單位, 所以本來有比較完整的預測為了比較就簡化成一天, 真對不起這些人.

4. 除了真實的溫度外, 還有 "Feel Like/感覺" 的溫度, 因為溫度也包含濕度, 風速等等的綜合評斷, 只是很可惜無法做為 KPI, 不然是個好東西.

5. Weather Bug 還有 "Dew Point/露點" 的預測, 風量與風向的預測也不少, 這個都是種參考.

6. 台灣中央氣象局等也直接寫出 "感覺", 像舒適, 等, 這個很難去量化當 KPI.

以上來看就知道單純就最高溫與最低溫就有很多種觀點, 而有沒有下雨就更麻煩了.

1. 最常見的就是下雨機率, 這個理論上是 0% 或 100% 機會最高的, 但實務上 0% 是偶而會見到, 100% 是不太可能出現, 因為這個還有時間與地區的因素考量.

2. 若比較模糊的預測就是寫 "晴時多雲偶陣雨" 這樣的描述時, 就只好去抓 "雨" 這個字, 或者是國外會寫 Shower, Rain 等等, 若甚麼都沒寫就只能當 0%, 若有寫到的話就當 100%.

3. 如同溫度一樣, 若一天有不同的預測, 就將這降雨機率平均, 這也是最痛苦的決定, 因為理論上也應該是最新的一次是最好的.

4. 更精確一點的預測, 應該就是預測當天的降雨時數 (Rain Hour), 這是較好的, 但這只有一家這樣寫, 所以最後只能是若降雨時數不為 0 時就是 100%, 不然就是 0%.

5. 比較準確的預測方式應該是預測雨量, 但這個雨量是跟下雨的時間有關, 因此像 Accurate Weather 就直接寫小雨雨量, 下雨雨量, 陣雨雨量, 雷雨雨量去區分, 就可以知道下雨的真實狀況.

降雨的機率跟溫度不一樣, 溫度大家都有, 降雨機率並不是每一家都有, 都是有各自的方式, 但若真的要設定 KPI 來作比較, 必須還是要有共同性, 這共同性就是一般化/Normalization, 但在一般化的過程必然會損失很多資料, 理論上是能避免就避免, 不能避免的話也只能趨近, 所以這兩個指標居然差了三個月才寫出來, 並不是程式很難, 而是要找到較好的方法真不容易阿.

而最近中央氣象局的網站有改版, 而改版後又多了不少資訊, 尤其是降雨的狀況的觀測真的是以區為單位了, 只是目前只是做記錄, 並沒有做預測, 因為現在中央氣象局是跑模式後再經過人的判斷修改做最後結果, 這個要到區鄉里鎮是不太可能有這人力的, 但此時若是靠 Data Mining 又可以有不同的觀點了, 改天來做 "你那邊再過 38 分鐘會下雨喔~~~" 這樣的系統.

事實上我們台灣的中央氣象局不是沒有在努力, 最近也做了一個可以更精確預測的劇烈天氣監測系統, 真的可以給予掌聲, 只是這個外包商不知道是民國前那一年成立的, 這系統不只是 Microsoft Windows IE Only, 並且是以 1024*768 的解析度為主, 還必須安裝程式才能跑, 只能說台灣政府離 Open Data 有點距離, 只是這題目一講就會講不完了. (此段為錯誤訊息)

2011年7月15日 星期五

神貘天氣: 下雨的預測準確率

上一篇講到我們國家的中央氣象局的預測準確率, 本來以為不會多好, 後來發現事實上還不會太糟, 甚至可以說是在 A 段班的, 而我一直沒寫下雨的準確率時, 認為這個應該大家都有 8 成到 9 成的準確率, 結果我錯了, 事實上有 6 成到 7 成的準確率而已.

這次的計算因為有點小麻煩, 因為有若是要計算溫度的話, 最簡單的就是用每日的最高跟最低溫做比較, 但每天降雨機率的預測本身就是一個在變動的數字, 每次預測都不太一樣, 但這個並沒有最高最低, 只有全有與全無 (有下雨與沒有下雨), 所以到底要如何去做 KPI 的準確率就讓我想了許久.

最後還是把每次的機率給平均起來, 做為當日的預測, 唯一的問題就是每一個單位預測的方式都不太一樣, 所以要先 Normalization, 而接下的計算就跟溫度的預測差不多了.

說起來溫度的預測是有很多解空間 (可能是 40*40) 的狀況, 但下雨與否的解空間好像只有 2, 也就是有跟沒有下雨, 因此預測起來應該很簡單才對, 且大家都說有下雨預測本來就應該有 8 成以上的準確率來看, 說起來感覺也沒那麼困難, 我本來也不太想把這個差別不大的預測當 KPI, 但現在算一遍後, 發現我錯了, 因為大家多數是在公布下雨機率的情形下, 解空間暴增為 100, 這預測變得沒那麼簡單了.

天氣穩定的話, 說要達到預測率 100% 是不難的 (畢竟解空間只有 2), 且控制在 8 成也是沒問題的, 但天氣一不穩定, 只要超過 3 天以前要預測有沒有下雨似乎比想像中的還要難, 事實上八成準確率指的是昨天預測明天, 但這個 KPI 若是延長到五到十天, 當然困難到就更高了, 下表就是現在檢驗的結果 Snapshot 快照:


而這張圖是取自今天 (7/15) 的 http://weather.datamining.tw/kpirain.php , 並不意外第一名可以是在 8 成以上, 但有時第一名卻不到 6 成, 當然平均起來至少有 5 成以上, 但也常常超過 5 成的誤差, 這代表這預測比猴子還糟糕.

只是目前來看, 我們國家的中央氣象局表現的比溫度的預測還要糟糕, 雖然有 6 成 5 的準確率, 但是排名第三名, 比 Weatherbug 以及對岸來得差, 這可能就有點須要檢討了.

而在完成下雨預測的 KPI 後, 加上溫度的 KPI 就完成檢核點的計算, 而進一步是能不能就這些預測做不同的 View, 也就是說我們可以不做天氣的預測, 畢竟這是專業的, 但我們可以利用資料探勘來計算誰的預測比較準, 這代表的是有沒有可能有更高的準確率呢? 請大家拭目以待吧.

2011年7月14日 星期四

我的 Mac 與 G700 的邂逅? 不, 死纏爛打.....

是我的朋友就知道, 某隻動物很常說: "滑鼠是除了你另一半外, 最常摸的東西, 不, 可能還要常...", 所以說, 找一隻好用與合用的滑鼠, 其重要性不輸給找對的另一半 (誤).......

雖然 "效率" 是句充滿 "罪惡" 的名詞, 但若因為有好的工具, 因此可以好好的工作 (或玩), 是件合理也不過的事, 在之前我已經有太多文章去 "推廣" 三螢幕, 或是 "六螢幕", 也講過幾篇 "左手鍵盤/雙滑鼠", 或是幫助你輸入的 "Gadget", 等等的東西, 但好像還沒寫過滑鼠的事, 但這不代表滑鼠不重要, 是太重要了.

在我開始用 Macbook Por 成為我工作的唯一的平台時, 一開始用的是 Logitech MX1000 與 M950 之類的大型桌上滑鼠, 但這真的很不方便攜帶, 因此不到一年就換了 Logitech VX Nano, 而這一用, 就用了兩三年, VX Nano 當然是當時為了 Notebook 做的滑鼠, 而 Logitech 對 Mac OS 都有比別人好的支援, 因此說要換成其他滑鼠的機會不高.

VX Nano 除了小外, 還有兩個多出來的功能鍵, 這個在 Mac 的使用上, 我都設成 Desktop (桌面) 及 All Application (顯示所有應用程式), 這樣的切換, 比 Task Bar 之類的快太多了, 且不用去移動滑鼠, 只是人是貪心的, 兩個不夠用往往想要的是更多的, 而當 G700 出來的時候, 說這個 13 鍵都可以定義時, 我就躍躍欲試, 但結果是 "Only Support God Damn Windows" 時, 就只好冷下來了, 期待那天 Logitech 羅技大發慈悲的出 Mac OSX Driver 再說.

當然一個滑鼠的好用, 須要用很多方面來討論:

0. 人體工學: 好握是很重要, 每一個人都不一樣, 要看手的大小及習慣來選擇.

1. 解析度: 解析度越高當然代表你能夠在最短的距離去你要的地方, 這對手的疲勞幫助相當大, 當我忘記帶滑鼠一換到別人的滑鼠時, 用一整天手都會很酸, 這個尤其在用多螢幕時會更明顯.

2. 按鍵: 有的滑鼠按鍵抄難按, 按到手酸都還沒按下去, 當然除了標準的兩三鍵外還有其他的鍵可以自設的話, 那就太棒了, 當然人一隻手指頭只有 5 隻, 太多還是會搞混的.

3. 反射能力: 從光學到雷射, 滑鼠的定位靠的是跟桌面的關係, 早期滑鼠是用滾輪, 但我想現在應該沒甚麼人在用了吧, 而雷射的波長比紅光更短, 雖然須要更高的運算速度才能解析, 但有能力解析的話不只解析度能增加, 也可以在更多桌面上使用, 現在還有可以在玻璃桌面上用的滑鼠.

4. 滾輪: 現在沒有人不用滾輪的滑鼠吧, 所以這邊要說的是滾輪的好壞, 尤其是好的滑鼠往往有無段跟有段的切換, 甚至驅動程式有加速能力, 都會讓滾輪變好用.

5. 定位能力(滑鼠墊): 這定位能力指的是準確度, 當然這個不只跟滑鼠有關, 滑鼠墊的因素也是相當重要, 有些人喜歡用照片或有圖案的滑鼠墊, 事實上透過不同的顏色與材質都會有些微不一樣的反射狀況, 一個好的滑鼠當然沒問題, 但不夠好的滑鼠就會有問題.

6. 滑鼠墊片: 滑鼠好滑很重要, 好滑就是在於與滑鼠墊與桌面接觸的那個地方, 通常會有個易滑動的墊片, 但這個用久了會磨損, 因此過一陣子就要換掉, 你可以去光華商場買, 這是很多人很常乎略的一環.

7. 無線: 這個最後講, 因為這個各有利弊, 像這隻 G700 就有雙模, 想要無限制時就拔掉線, 追求精確度時就插上線, 當然並不是每一隻都能這樣, 所以要好好想清楚你要的方向, 但通常除了打電動外 95% 都是選無線準沒錯.

N. 價位: 都已經說這個比選另一半還重要了, 你還在用不須要請小朋友出面的滑鼠嗎?

而在有一次, 以為我的 VX Nano 丟掉時, 我就再次尋找, 雖然官方還是不支援 Mac, 但已經有人說是可以用的, 利用其記憶設定的方式, 先去 Windows 設定再來 Mac 用時, 我這時候也終於有 Windows 的電腦了, 因此是有機會是可以一試的, 只是有兩個大問題, 一個是雖然說可以去 Windows 設定, 但 Windows 的功能鍵跟 Mac 是不一樣, 而對我最基本的 Desktop 與 All Application 不是普通的按鍵, Windows 不見得會有, 即使其他鍵可以設, 對我而言還是有跟沒有一樣, 但最後沒買的原因是一個更重要的原因: 只是這隻死老鼠躲進我包包的夾縫, 只是一時沒找到.

雖然後者的因素沒有了, 但前者的因素我還是要去了解, 因為真的有人說可以, 所以在發生 628 癮事件後, 我剛好有兩個理由真的去找那位朋友測試滑鼠兼問八卦了.

一開始時, 發現 Logitech Control Center 真的抓不到 G700, 所以我只好仔細研讀那篇文章, 他說有兩個方法:

1. 利用記憶設定先去 Windows 設定 (這個大家都知道)
2. 改用 SteerMouse Driver

事實上我在三四年前為了解決 M950 時, 也是使用 SteerMouse 的 Driver 來去辨試, 就立刻下載來用, 發現所有的鍵真的可以抓得到且能夠去自己設定, 更重要的是 Desktop 與 All Application 的 ShortCut 方式甚至比羅技官方寫的 Driver 更好設定, 因為以前為了要做到這件事, 是必須要把這功能 Bind (綁) 在功能鍵上, 然後去 Emulation, 而現在是完全不用, SteerMouse 一開始就可以直接選這樣的功能.

所以過了幾天, 我就下單了...

這篇就這樣完了嗎? 那樣這篇就是閃光文意味居多了, 我寫這篇除了要勸敗外, 是要跟大家討論你會如何設這些鍵?

我一開始是這樣設的:

1. 左上角有三個鍵: 依序是 Expose 的 Show Desktop 與 All Windows, 第三鍵是 Switch Application.
2. 姆指四鍵是: 空白, Enter, Firefox 與終端機, 因為空白可以翻頁, Enter 可以直接輸入, 而 Firefox 與終端機是我最常用的兩個應用程式.
3. 中鍵按下去是另開視窗, 也就是 Command Primary Click.
4. 中間在滾輪模式切換下面的那個鍵是 Move to Close Button.

我原本是這樣設的, 但後來才發現一個 SteerMouse 也可以支援不同應用程式有不同的設定, 此時我就設:

1. iTunes, 把 Firefox 與終端機那兩鍵變成下一首與上一首.
2. Firefox 模式時: Firefox 那鍵變成上一頁.
3. Terminal 模式時: Terminal 變成 Copy.

我一直很納悶工作的須求市場應該比遊戲市場大很多, 且一個好的輸出入設備對工作效率影響很大, 但為甚麼沒有多少上班族知道這重要性, 更廠商也沒有去針對這方向去開發中高階市場, 最後變成電玩或電競的設備變成是較好的選擇, 我相信若能夠針對這樣市場去開發應該很有潛力阿....

2011年7月11日 星期一

Google+ 的圈圈及以外的六項武器

"若有一個像噗浪一樣好用的系統, 但有小圈圈的功能, 我二話不說一定會跳過去..."---- GH404X, 2009 (噗浪第一年)

在 Google+ 襲捲台灣不到兩個星期, 噗浪在 Alexa 跌了一名, Twitter 留言銳減, Facebook 有沒有受影響? 沒有人說得出定論, 但已經出現不知道多少有趣的圖來說 Google+ 如何掌 FB 一巴掌了, 所以要我來做個有趣的預測的話, 我會說:

1. 噗浪既有的人口有一半會被 G+ 帶走, 因為噗浪的好操作以及實用性在某方面是無法取代, 對於不依賴資訊的人是足夠使用的, 加上還是有新人進來, 只是未來的高峰應該只有現在的 70% 而已.

2. 由於 Google 使用者將會有 9 成轉成用 G+, 其中台灣與 Twitter 的使用者族群重疊, 因此 Twitter 在台灣未來可能連現在的 3 成都不會到, 畢竟 G+ 是給資訊缺乏症者很好的藥, 給傳教士有很好的管道, 給公關與媒體業的人制定圈圈極好的工具, 可能在台灣受影響最大的是 Twitter 了.

3. Facebook 會不會影響這麼大是很有趣的問題, 雖然說 9 成使用 Google 的用互會放棄 FB 轉到 G+, 但 Google 的用戶並從廣義到狹義是 2 成到 4 成之間, 尤其是那些 Yahoo 的使用者不太可能因此轉移, 因此接下來的問題不是 Google Plus 的挑戰而已, 而是 Google 在台灣的挑戰, 因此 FB 在台灣的成長空間不只是是要面對全球 FB 滑落的問題了.

4. 部落格的影響可能在 Plurk 或 Facebook 的成長時已經打擊過了或使用者轉移過一次了, 而現在的問題不是 G+ 的功能, 而是未來的功能, 若增加與其他社群的結合時, 反而對 Blogger (現在已經叫 Google Blog) 不是壞事, 相較前面幾種微網誌, 部落格可能是影響較小的.

但這篇文章不是想寫台灣在 Google+ 出現之後對 SNS 的影響, 而是未來的幾個關注重點:

1. Toolbar: 10 個人有 9 個人說 G+ 最大的 Killer Function 不是在於他的自己的功能, 而是 Google 這隻大雞可以帶小雞的能力, 其中若是所有的 Google 的服務都有 G+ 的 Toolbar Button, 以後幾乎沒有人不會在用 Google 時順便使用 G+了, 尤其是 "分享" 是種會擴散的東西, 這在未來是相當重要的一個因素.

2. Search Engine (+1): 由於 Google 有搜尋引擎的優勢, 因此這個 +1 很快的就放在搜尋結果頁了, 再加上相關服務, 在未來可能 +1 會無所不在, 在上跟上面 Toolbar 的相輔相乘, SNS 須要的就是足夠的內容與服務, 這個對 Google 而言跟本不算甚麼.

3. Android: Facebook 與 Twitter 最大的問題是沒有 Device, 但 Google 有 Android, 我們都知道原生機器的優勢, 未來 Android 與 Google+ 的結合, 無論是訊息, 視訊, 相片, 定位 (LBS), SNS, 若是在每個 Android 都是內建 G+, 那誰要用 FB 阿? 話說我還沒有 Android 手機, 有錢一定要買一隻.

4. OpenSocial/FriendsConnect: 若是 Google 可以有 FaceBook Markup Language 那樣的 Container (容器), 此時 Google+ 是很好的 Platform 了, 加上跟既有的 OpenSocial/FriendsConnect 結合, G+ 可以在 Blogger/Google Blog 遍地開花, FB 也不得不更開放 FBML 了.

5. API: Google 的透通性 Transparent 是眾所知道是最強的武器, 雖然到現在沒有真的公開其 API, 但可以相信會相當有趣的, 很多 Developer 開發者已經躍躍欲試了, 當然 G+ 的樣式在未來應該會比 Facebook 更開放, API 應該也無庸至疑的.

6. Gtalk: 在之前, gtalk 並沒有較好的圈圈與分類的功能, 但在有 G+ 的視訊聚會功能, 基本上就像是一個很自然的聊天室, 尤其這個跟 Andriod 與 Gmail 的結合, 我已經準備買一台 Android 手機了.

上面說的六項重點, 說是 Google+ 的六項武器也不為過, 但真正紮實的攻擊力就是圈圈, 目前就 Google+ 來看有下面幾種圈圈的可能性:

1. 社交圈以及分類: 任何訊息可以設定圈圈閱讀, 這個分類可以做任何組合, 目前圈圈的發布是很彈性, 但閱讀還無法做組合, 例如只讀幾個圈圈的訊息是沒有的功能.

2. 延伸圈圈: 目前延伸圈圈設定為有加你為圈圈但你沒去圈他的人, 所以這訊息算是半公開的, 但在實務上還是有特定對像, 這對於某些隱私有很不錯的幫助.

3. 被管理的圈圈: 粉絲團或社團在 Google+ 可以很輕易的用外部控制的圈圈來做到, 包含開放加入或管理者申請加入的, 這個在於用在共同協作平台或工作及 "組織" 有很不錯的幫助, 就像是加好友或圈圈, 若是社團屬性的話, 只要一加入這個圈圈, 就不用當新人一加入後每一個人都要加入了.

4. 組織化的圈圈: 目前這些圈圈並沒有子集合或母集合的觀點, 若是有這樣的組合的話, 圈圈的管理會更方便, 你只要做其繼承, 很多連結(圈入)只要設定一次就可以出現在其母圈圈, 就像是公司與部門, 甚至是管理者的小集團.

當然目前 Google+ 的圈圈還沒有組合, 管理, 外部, 但若能做到這樣, 圈圈的管理會更人性, 但相對的會更複雜, 但這些都是 Option, 不是必要, 但之中取捨的拿捏蠻不簡單的.

但說到這樣, 似乎代表 Google 的戰略面真的很厲害嗎? 但事實上再好的戰略也要有足夠的資源去支持, 沒有以前的努力, 怎會有現在的資源呢? 這也是大G 帶小g+ 的真締阿?

註:圖是紅色死神幫我畫的, 特此致銘感謝.. 跪泣...

User Behavior Feedback to Content 使用者行為回饋內容系統 (I) 前置與前言

網站的經營最有趣的地方不是在於網站的內容而已, 而是如何跟使用者互動, 這跟其他非互動媒體 (雜誌, 報紙, 等等) 不一樣的地方, 至少在時效性是完全不一樣的...

大家都知道, 這個互動包含 UGC (User Generated Contents) 以及最單純的網站觀察所帶來的經營參考, 當然這個對每一種網站都有不同的方向與重要性, 無論是電子商務網站, 討論區網站, 活動展示網站都會有不同的考量.

只是大家都知道使用者導引是很重要 UI (User Interface) 的一環, 當然這個利用在圖書館定位是種參考服務, 早期這種東西都是用人來操作, 這是最人性的方式, 但事實上在成千上萬的使用者網站來看, 這種 "Guide" 導引服務是不可行的, 一定要用機制來完成, 這種機制有三種方向:

1. 使用者自己的行為
2. 其他使用者的行為
3. 使用者自己對應在其他使用者的行為

說到第一項大家都知道就是在你去看拍賣網站或電子商務網站中的 "你瀏灠過", 或者是在討論區網站的 "你回應/發表過", .... 等等的項目, 因為人的行為若在網站上有互動, 其行為是某種收歛的, 因此從過去的行為就可以做為未來行為的導引是無庸至疑的.

第二項是其他使用者的行為, 最常見的是排行榜之類的資訊, 因為即使每一個人的行為再怎麼不一樣, 都有其共通性, 所以大家的共同行為是很好的導引. 但除了無聊的排行榜外, Data Mining 提供了對單品/單文章做進一步的共同購買, 關聯閱讀是最常見也最直覺的方式, 當然這個的計算是比排行榜須要更多的資訊與資源才行.

最後一項是若我們也搜集足夠的資訊, 無論是對整體, 族群或個人, 就應該可以進一步對一個人做建議與導引, 這個在 Facebook 的好友建議已經有不錯的展現, 只是這個若能更加入一些回饋就好了.

但我寫這篇不是要講上面這三點, 因為這三點這樣的邏輯是誰都可以推論出來, 只是要如何做呢?

我們都知道, 經營一個網站要從使用者給導引, 但這個導引必須要從這些 Raw Data 找出共通性, 若沒有了共通性, 任何一個點擊, 任何一個網頁瀏灠都是獨立的, 若沒有共通性來指引, 就無法歸納出經驗以及可行性來做協助.

當然資料本身很難有共通性/共同性, 往往須要人的協助以及人的定義, 例如一個點擊沒有意義, 但我們可以把一個網頁切割成很多區塊, 從區塊的 click through 來跨時間以及跨類別之類的定義後, 就可以讓使用者使用資訊變得更精確.

因此若我們經營網站有個 KPI 的目標, 無論是消費, 貼文章, 等等的最終端行為一定會有很多的過程, 記錄這些過程不只用來我們做為結果因子分析很有幫助, 更者這些過程若能做為其他的使用者做導引, 更容易導到我們最想要的 "終端行為", 所以這些行為不能只是做為分析用, 更可以內容使用, 而有那些行為應該記錄呢?

1. 使用者是因為那個網站來的?
2. 使用者是因為那個關鍵字來的?
3. 使用者在網站內部最近是搜尋那個關鍵字?
4. 使用者是因為那個活動進來的? 或者是終端行為最後一個活動是那個?
5. 使用者最近點過那個首頁區塊? 或者是第一個首頁區塊?

當然還是有很多行為是該記錄的, 無論這個終端行為是 "下標", "下單", "發文" 等等, 因為網站的屬性多少都有不一樣的狀況要記錄, 而把這些資訊足夠被記錄到 Cookie 的時候, 當終端行為發生時, 就可以對這些行為做回饋, 那怎麼回饋呢? 就下回分解...

備註: 原圖取自 http://www.erinlynnyoung.com/244/user-testing-fallacies/ , 不知有多少網站真的做過 User Testing?

2011年5月24日 星期二

難道中央氣象局都不準嗎!?

在寫這 "神貘天氣" 系統的時候, 並沒有去假設我們中央氣象局的準確與否, 倒是真的以一個較為開放的方式去定義 KPI, 並沒有刻意或有意的去證明我們台灣中央氣象局的好與壞, 因此在當時寫出來發現中央氣象局相當不準的時候, 相當驚訝, 而在記者報導的時候, 我們才發現資料有問題, 所以才會很 "厚臉皮" 的請報社拉下這篇報導, 而現在經過一個月了, 數字已經正確了, 所以可以回頭來看中央氣象局到底準不準.

從四月21日到現在已經有 34 天了, 在 6 個資料源的比較下, 若是以每日最高準確率來看:

Acculate Weather: 11 天
Weather Bug: 9 天
The Weather Channel: 6 天
中國中央氣象台: 4 天
台灣中央氣象局: 4 天
***Mask***: 1 天


原始資料在這邊, 用這個圖表來說, 我們的中央氣象局好像很糟糕, 但用我們實際 KPI 的定義跑出來看, 卻是下面這張表:

除了 30 天以及這週, 不是中央氣象局第一名(上個月因為有包含到 4/21 之前的錯誤資料我們忽略), 甚至迄今的第一名也是中央氣象局是最準確的, 為甚麼會有這現像呢?

仔細看每日戰積, 雖然中央氣象局第一名的次數很少, 但在前三名的機會到高達 65% (22/34), 也就是說有一半以上的機會都在前段班, 甚至最後一名的次數只有一次, 或者是以 KPI 的量級來看, 中央氣象局雖然不是最準確的, 但大部份的時間都誤差不大, 因此在平均的結果, 幾乎都能夠拿到第一名的原因.

所以若是要問我對中央氣象局的觀點是甚麼: 中央氣象局雖然不是最準的, 卻是不會最不準的.

目前的 KPI 只有溫度的準確度, 而接下來會計算我們最關心的下雨準確度, 甚至是兩個加起來的綜合指標, 這會不會造成結果的不一樣, 讓我們拭目以待.

2011年4月15日 星期五

神貘天氣都不準


Weather.DataMining.Tw 做了一個多月了, 這代表資料也搜集一個多月了, 已經幾乎到可以發表的狀況了, 且有個記者朋友也真的寫了篇採訪稿, 但他跟我們講中央氣象局的人說我們的資料有問題, 我一面岔意一面檢查, 果然資料真的有問題.

雖然在這種抓資料的程式, 最麻煩的是要處理很多例外以及抓不到的狀況, 所以做了很多檢查點, 應該是經驗已經很夠了才對, 但這次很意外的是在最後寫入資料庫時, 因為是 Copy & Paste 的關係, 不小心把之前沒有用的程式碼給複製了, 造成正確的資料被覆蓋了, 寫入的當然是不正確的資料, 而這影響的部份是中央氣象局在預測一周的天氣時會發生的.

因此若要真正正確的資料, 要過一週後才會是新的資料, 也就是在 13 號修正後到 20 日之後才是真正正確的 資料, ...

除了既有上次的 KPI 外, 也寫了個逐日戰積, 大家可以知道每天的比較表...

因此在 KPI 有個迄今, 到時會從 4/20 開始計算, 原本是 3/19, 因此晚了一整個月, 所以我之前真的錯怪中央氣象局了, 雖然我知道我是公正去評斷, 但若搜集資料錯誤的話, 就等同 Garbage In Garbage Out (GIGO), 這是很大的錯誤.

有人看到我寫 "台灣天氣網", 以為我抓的是另一個民間單位, 事實上這資料都是取自 "iTenki" 的 "天氣風險管理開發", 所以也在新的網站做修正.

明眼的人一看就知道有套新的版型, 這是由 "紅色死神" 做的, 但我還沒套完, 等套完之後應該會給大家驚豔, 畢竟這個是 "神貘天氣", 指的是我們兩個開始初期開發的網站...

所以要等到真正有價值的資料, 可能要等到 5 月, 請大家再多等待一陣子吧, 真不好意思.

2011年3月25日 星期五

甚麼天氣的圖阿?

我也知道圖在 What's the Weather Web 神貘天氣是很重要的, 所以要畫圖也要有圖解阿, 只是說實在的, 深入淺出是我最不善長的一環阿, 本想請人幫忙寫的, 但還是自己跳出來寫好了...

上圖是取自於 3/23 在 Weather Channel 對 台北 的天氣預報, 而 Weather Channel 是在當天就不會再預報一次的天氣, 而是在 9 天前就開始預報天氣, 所以在 X 軸雖只看到 -8, -6, -4, -2, 但事實上前後還有個 -9 與 -1, 指的是在 3/23 的幾天前的預報...

很明鮮的在 3/23 的前 9 天也是 3/14 對 3/23 預報是 13~15 度, 依序下去每天都有對 3/23 有預報, 所以紅色是預報的最高溫, 藍色是預報的最低溫.

綠色是在 3/23 我們實際測得的溫度是 13~15 度, 而整體而言都算很準吧, 因此我們要看誤差的話, 應該是看紅色線跟綠色上端的面積和與藍色線與綠色下端的面積合, 而在這個圖就是很明顯的高於綠色到紅色的面積與低於綠色到藍色的面積就是誤差.


而這張圖是當天中央氣象局的預測, 而中央氣象局是在 7 天前才開始發布那天的預測, 而到當天也會持續發布當天的預測, 而這邊來看, 藍色線都比綠色還要高或一樣, 所以低溫的誤差是藍色到綠色底的面積總合, 而高溫的誤差有一天是較低的, 但在面積來看還是可以把三塊面積加總, 但所謂三塊面積加總事實上也是每一天的最高溫預測與實際最高溫的差總合, 當這兩個總合加起來就是總誤差, 若跟上圖來看可以看得出來誤差相當的大.

因為每一個單位預報的週期都不太一樣, 因此我們會依天數做平均, 只是這個平均不是都維持每天不變, 而是依天數的差距乘上等比級數 0.9, 這個也是說, 越早預測的比重也越低, 也是說若我們認為預測明天的天氣是 90% 的話, 昨天預測明天天氣則是 81%, 前天則是 73%, 依續下去, 而明天當天的預測比重則是 100%, 因為若是當天預測當天還有誤差, 這當然是最糟糕的囉.

2011年3月22日 星期二

神貘天氣哇 What's the Weather Web 公測


在 3/21 大概完成了一個初步的心願, 這是從莫拉克之後, 雖說一直想去中央氣象局看能不能做點甚麼貢獻, 但說真的, 我須要學習的東西還很多, 因此只好先自己做吧.

資料探 勘的假借法? (Data Mining)文章說到, 有時我們無法取得第一手資料, 但我們可以嘗試用有系統, 可以自動化, 較為客觀的第二手資料做 "加工", 獲得要的答案, 就像是我們無法取得台北市交通狀況, 但從網路上公車的行車記錄幾乎就可以算得出來台北交通狀況, 用這個當 KPI 是再真確不過了.

因此若要了解天氣預測的準確與否, 最簡單的就是比較預測與真實的關係, 所以這計劃就產生了前題, 而接下來就是從這二手資料中, 是否可以純用數學模型算出一個比這些天氣預測系統取得更準確的 KPI 呢?

花了 10 天, 終於把這個 Weather DataMining 做個了斷, 嗯, 是基本的雛型, 也就是先定義出預測準確率的 KPI, 這公式很單純就是:

1. 從今天, 昨天, 前天一直到有預測今天氣候的資料做記錄, 跟實際今天的溫度做比對, 最簡單的就是取面積 (積分這差距).

2. 距離越遠的日子, 準確率應該也越低, 所以採取個等比比重做為調整, 且每一個單位並不是擁有相同的預測天數, 所以也要 Normalization (正規化), 目前每早一天, 就比前一天少 10%.

3. 最近這三天的預測應該是要最準確的, 所以我們特別做了個加權, 因為也不是每一個單位都有針對 "今天" 做預測.

最後就以上述的公式定義出溫度預測準確度的 KPI 了.

Weather DataMining 氣象探勘這篇文章提到, 是否預測穩定度跟準確率相關, 所以我們接下來定義穩定度是甚麼? 穩定代表一定有變化的差距, 目前有幾種可能定義:

1. 當天跟(前一天以前的平均)差距.

2. 當天跟前一天的差距.

3. 當天與前一天的差距以及更之前差距的等比累積再正規化.

而會先試算看看才知道那個較為準確, 說不定實務上又會做綜合指標, 而若能找出穩定度, 又能找出穩定度與準確率的關係, 此時新的預測模型就會出來了.

這個網站最早是我跟紅色死神開始規劃的, 因此想說以我們兩個人的名字命名, 本來最初是想說來個 "紅黑大對抗", 或者是 "SunDog/紅獸" 這樣的想法, 但在偶然之間取最後兩個字, 跟 "什麼" 有相當的諧因, 所以就變成 "神貘天氣", 而最後是想說加個驚歎語, 而原本是叫 "阿", 後來改 "呀", 最後為了配合跟 "WWW" 致敬, 所以就變成 "哇" 了, 因此目前公測的名稱是 "What's the Weather Web (WWW)".

有不少朋友說願意一起來幫忙, 包含如何 Deploy 到 ipad/iphone, 現在已經有個雛型了, 所以準備開始好好的玩了, 我最近就會敲大家了.

(圖例就是網站的圖, 可以看出從當天以前之前每天對溫度預測的變化, 若是當天已經是發生了, 就會有綠色範圍指示真實溫度, 因此可以輕易看出準確率, 而網站網址為 http://weather.datamining.tw 神貘天氣哇)

2011年3月19日 星期六

從歷史圖型來看數字預測

在系統調校的一開始, 我一定會問大家一個問題: "系統負荷 60% 是過高還是過低呢? 系統負荷 6% 是過高還是過低呢?" 當然這個 "過高過低" 指的是一種不正常的現像, 而在之前要有一個前提: "何謂不正常?", 所以就要知道這系統的歷史記錄, 一台機器平常都是 80% 在跑, 現在只有 60% 負荷, 表示有甚麼工作沒在動了, 而若是平常一台機器負荷還不到 1%, 現在跑到 6%, 一定發生甚麼問題.

因此, 歷史資料對於我們的判斷是相當重要的, 尤其在很多可以量化的時間序列來看, 要搜集與儲存這些資料是相當重要的, 但接下來的就是要去判斷, 因為這判斷未來所須要的資訊就是來自於過去, 加上自己的想像與經驗(模型), 這在資料探勘中, 就是屬於資料搜集, 資料清理對接下來的資料探勘的重要性.

但在之前, 到底怎樣的判斷 (探勘) 是對或錯呢? 我常常說, 資料探勘所知道的可能是大家早就已經知道的東西, 只是要在短時間內從這麼大量的資訊做出大量的決策是人做不到的, 即使這事可能是由人來做是最好的, 所以電腦只是來輔助人的判斷, 而在真的去 "處理/探勘" 之前, 最直接的方法就是: "Data Presentation/資料呈現".

說到這些數字與資料的呈現, 最常用的是表格與圖型, 但說到要能夠直覺的一目了然, 還是要從圖型來看, 因此我常會要求用 MRTG 或 RRDTools 來做出一個基本的圖, 因為這是輔助判斷的最好方式.


我常會說, 人眼與心智是最好的判斷系統, 就像上一張圖, 這是一個歷史資料圖, 若我們知道當上面的線圖接近到 100 時系統就會有問題, 那看了這張圖, 你認為合理的狀況這三五天內會不會出問題呢? 若是用電腦的模型來看至少有兩種方式:

1. 迴歸: 就上圖一算, 數字的變化是往下降的, 說不定過不久是 0. (黃色線)
2. 平均: 目前剛好是平均, 所以應該沒甚麼大變化. (藍色線)

但我們人眼一看就知道, 趨勢不是紅線就是淺藍的線, 不應該是黃色或藍色, 若是淺藍的話, 大約 5 天就會出問題, 若是要樂觀一點來看, 紅色會出問題的日期還要 10 幾天, 所以還有更多的時間, 但出問題是必然, 只是若用上面兩個常用的模型來預測, 往往會失準, 但相較之下畫出圖後用人來看反倒是最準的.

在上一篇的 "氣象資料探勘" 的文章中, 收集資料後, 當然就是要做進一步的分析與預測, 但新的模型與方法找出來至少要一段時間, 因此在之前想要讓大家知道誰預測比較準確, 最簡單的方式就是畫出圖來, 這就是明天各家氣象預測的歷史軌跡圖:



這張圖可以看得出來除了 The Weather Channel 在高溫在今天有下修外 (大概是昨天上修太多了) , 大家都是維持往上修正, 所以當大家看到各家的天氣預測, 應該心裏有個底, 就這個趨勢來看溫度不太會比預期得還要低才對, 當然這也是除了預測外, 若能知道 "預測的歷史趨勢變化" , 在對於這種有 "時間性" 的預測往往會有更準確的感覺, 這也是有趣的地方.

當然這只是一個示範, 而這計劃目前暫時定名 "神貘天氣呀", 這說是 "甚麼天氣呀" 更應該是說我跟 "紅色死神" 一個小小合作發想的作品, 除了希望做出更個人化, 更人性的預測外, 也打算做 iphone/ipad 的 app 來讓大家玩, 所以有甚麼建議請大家多跟我或死神說.

2011年3月9日 星期三

Weather DataMining 氣象探勘


在渾沌理論出來之前, 即使已經過了所謂科學終結的時代, 那時社會的氛圍還是在想說只要有足夠的資料, 就可以 "模擬(Simulation)" 出氣候給予預測了, 但是一隻蝴蝶(誤)把這想法給粉碎了, 但不代表說模擬計算不重要, 只是沒那麼 "絕對" 罷了, 因此在我小時候, 台灣最快的電腦不是在國家高速網路中心, 而是在氣象局.

無論是 Simulation 或 Emulation, 我們知道在計算在氣象可用的模型是相當多的, 甚至有很多歷史資訊可以參考, 但套句 Data Mining Forecast 兩大定律: 天底下無新鮮事, 天底下沒有相同的事, 再怎麼計算也只是種猜測與推估, 只是眾多可能性之一, 但到底除了這個之外, 還有沒有其他候選答案, 也就是 Minority Report, 這個可能在現實上要大眾了解是須要再教育的, 只是預測的單位不只一個, 無論是中央氣象局, 中央氣象台, 還有國外許許多多的單位都在做預測.

當然這些都是不同的看法與觀點, 甚至因為適用性不同, 預報方式也有不同的角度, 但到底那個是最準確的呢? 基本上有了 iPad 後, 我就很習慣的多看幾家, 除了 Weather Chanel 外, Accure Weather 也是不錯的參考, 只是最後就實務上檢驗那個是最準的呢? 看樣子並沒有這樣的資訊, 因此我就想若是氣象預測的準確率是可以成為 KPI 的話, 到底誰能夠拔得頭幬呢?

事實上說要知道誰最準 , 就實際面應該是我們也是想要從中知道最準的答案吧, 甚至若是不準的話, 會往那邊偏差呢? 若心裏有個底的話, 也是相當不錯吧, 因此這個 Weather DataMining 的小計劃就慢慢在腦子形成了.

在還沒有公布答案之前, 事實上所有單位都會對某天做很多次的預測, 從兩週前, 到一週內, 到三天內或是在明天, 每次的預測都不盡相同, 當然我們知道時間距離越遠, 變因越多, 誤差會更高, 但若能夠掌握好的模型與變因, 理論上很快就可以在幾天前就收斂, 但實務上是即使說要預測 2 小時後的天氣都很困難了, 更何況是在兩天前, 我想除了 Nami 娜美外應該沒有多少人有這能力.

有了準確率的 KPI, 更可以用收斂穩定度做另一種輔助參考, 理論上預測穩定度跟準確率有相對的關係, 因為若是用最 "真確" 的方法去預測, 穩定度是 100%, 當然準確率也是 100%, 但這是不太可能的, 因此在沒有準確率公布答案之前, 是否可以用穩定度來做考前猜題, 倒也不失個好方法.

這計劃最主要是要滿足我對數字與預測的惡趣味外, 也希望用這個小計劃好好的自己踢一下, 不然我之前所提的計劃都太大了, 當然也真的做出自己以及大家想用的東西, 有意義的東西, 放在 ipad 用自己希望的 UI 來看, 而最後也是要慢慢朝向我莫拉克後, 想說對台灣氣象有些幫助的自我期許.

有誰還有對這計劃有興趣嗎? 來找我報名吧!

資料探勘的假借法? (Data Mining)

前幾天有一個很重要的事, 就是 M$ 自己做了一個 IE6 Countdoown 的網站, 希望在 2014 年能夠讓 IE6 從地球上消失, 但我這篇不是在寫 IE6, 雖然我是網站開發者, 只是我只處理到資料庫端而已, 所以我並沒有那麼痛恨 IE6, 所以當看完這網站我並沒有很大的想法.

但仔細看了一下這網站的數字, 這網站的資料是取自網路界鼎鼎有名的 Net Applications .com, 很多網路分析資料的數字都是取自於這間公司, 所以也沒甚麼好意外的, 而在一個噗浪的討論串中, 有人說了一句話: 亞洲好像是最慘的, 仔細一看, 亞洲說不定占了整個 IE6 的三分之二, 當然其中有一半要歸功於中國大陸.

討論到這邊, 台灣的狀況也沒好到那邊, 最後大家七嘴八舌的說台灣真正的問題不在民間, 而是在公家機關, 此時就講到這些政府單位的固步自封, 食古不化, 甚至到貪污腐敗的程度, 所以認真看了一下:

中國 34.5%
南韓 24.8%
印度 12.3%
台灣 10.7%
日本 10.3%
越南 10.0%
香港 7.6%
若不說這是 IE6 的占有率, 而是說公家機關的 "官僚度", 甚至說是 "資訊暢通率" 說不定有許多人會相信與認同.

事實上在任何數字背後都有其意義的, 這也是我常說的 "Nothing Comes From Nothing", 事出必有因, 很多事情無法確切的知道, 或者是量化的得到, 若是用另一個管道取得不同的資訊, 說不定真的可以參照.

而在這份數字中, 表現最好的是挪威與芬蘭都不到 1%, 這更似乎可以證明些甚麼的感覺, 但 IE6 的占有率應該是用兩個因子來造成的.

1. 資訊的利用率
2. 資訊的進化率

也就是說, 若都沒在用網路, 當然也不會有 IE6 的問題, 但若只知道使用網路, 而不知道去進化, 去更新, 這才是最糟糕的事, 我們很清楚的知道台灣的公家機關是如此, 但事實上也是人民, 廠商放任如此的結果, 也可以說這是社會的氛圍也不為過, 畢竟政府是我們選的, 我們建構的, 而從這邊倒是真的可以看清一些事情.

說到這邊, 大家應該會懷疑我的標題應該是 "從 IE6 來看台灣政治的困境" 這樣才對, 這也沒錯, 事實上我最近在玩一些數字的時候, 常常會面臨到一些問題, 雖然我們期望在資料探勘可以用較為 "平面" 的角度去抓取資料, 但事實上任何動作與行為都有出發點, 要能夠去避免偏見是不太可行, 只是這些也不是問題, 真正的問題是: "抓不到", 以及 "無法定義"...

尤其有些數字是人去填的, 就像是這次馬政府認定政見完成率有 88% 那樣, 說這是公正客觀的指標還不如說這是個話術比較實際, 因此有時候我們該去取樣的數字應該是更沒有立場的, 甚至是更大量的, 更即時的, 尤其若是用 "系統性", "自動化", "架構性" 的去抓這些數字, 能夠呈現的資料往往會超乎我們的想像.

例如我曾用噗浪去搜集過 "失眠", "感冒", "翻桌", "好熱", "下雨" 等等情緒性或較直接的現像的字詞計算來看社會, 有些是有點廢話, 當溫度交替時就會較多人感冒, 而我倒是想說若進一步的去搜集 "找工作", "失業", 說不定也可以呈現出社會的不同面與角度.

當然數字只是非常非常的表面, 不能用數字的表相來去看, 更應該像是統計去探索裏面的因子去做分析, 但這個倒不見的是 Data Mining 可以做的事, 畢竟有時我覺得資料探勘跟統計有點像 天文 vs 物理, 一個是你只能從觀察去找到答案, 另一個是可以去做實驗與驗証, 有時從這角度來看社會, 還覺得這個社會雖然說是個母體 (Matrix), 但說要去架構還真的不可能阿, 這也是人類有趣的地方.

下面是原噗的內容.

2011年3月2日 星期三

甚麼是 Context Switch


上一篇文章, 講了很多次的 Context Switch, 但到底甚麼是 Context Switch 呢? 我大概解釋一下.

電腦最核心的就是所謂中央處理器, Central Procesor Unit (CPU), 基本上就是接受指令, 輸入資料, 計算, 輸出資料做這樣的動作, 而事實上早期的電腦, 大多只有一個 CPU, 但要處理很多 Job 工作, 而最簡單的想法就是一個工作做完做下一個工作, 但這樣感覺後面的工作就一直在等待, 因此有人想說把工作切成很多很多部份, 而 CPU 每次就處理這些工作的一部份, 這樣感覺就是同時在處理很多工作, 稱為多工 Multi-Processing.

但事實上一個 CPU 一瞬間只能處理一筆資料執行一個程式, 一個工作須要成千上萬次的執行, 所以也不至於每執行一個指另就換下一個工作, 因為資料通常放在記憶體或暫存器 (Register, 就當作較快的記憶體), 而要把資料放在 CPU 能夠執行的記憶體才能執行, 這資料叫做 Context (文本), 但如此往往上百個工作事實上也無法把所有文本 Content 放在記憶體, 通常也要放進硬碟之類的地方, 等到要執行時再把要執行的資料讀進來, 再把部份資料移出去, 這動作叫 Context Switch.

很不幸的, 這個 Context Switch 的動作本身須要由 CPU 去做, 因此若是這個 Context Switch 發生的次數太多, 所花的時間也變多, 每個工作能夠分派的 CPU 在一段時間內能處理的次數也會變少, 甚至原本大家乖乖排隊可以在下次新工作分派之前執行完的情形, 反而因為 Context Switch 變多資源耗費很多便得無法執行完的話, 就會發生超越臨界值 (Threshold) 現像, 最後甚麼事都不能做或做得相當慢.

前面講完電腦的狀況, 但我們真正要討論的是人腦的狀況...

當然人腦到底有沒有這種 Context Switch 的現像呢? 當然我們都知道人可以一心多用, 甚至某些事情真的可以進到背景 (Background) 去執行, 只是人的思緒的確是有可能被打亂, 而在被打擾後, 想要回到原本的思緒的確要一段時間甚至回不來, 因此我一直在想, 我們工作的確會有這狀況, 而學習或唸書是否也會這樣子呢?

若真的會這樣的話, 人的學習應該是每一小時換一門科目或每兩小時換門科目呢? 而是修改成每兩天或每兩週再來換個類別 (例如數理一個類別, 文史一個類別), 事實上真正會須要換的原因是這些分門別類的科目, 在還沒有真的融會貫通之前, 做到 Knowledge is the One, 知識本一家之前, 我們是不是該在同一個時間內花更多的時間在一個科目或類別, 而不是一直換呢?

或許在某方面, 這樣一直換也不見得是壞事, 讓人的思緒更靈活, 但相對的也要付出還沒有深入學習就抽離的代價阿...

寫到這邊, 我 Google 到相關的定義:
1. Context Switch Wiki
2. Context Switch Deifinition
大家可以去參考看看...

(原圖取自 http://www.pedantique.org/)

2011年3月1日 星期二

Context Switch I: 思維切換的代價

在去年八月, 我寫了一篇從兩 種遊戲策略來看兩種生命模式, 說是為了要回應 Context switch in a Sprint?這篇文章, 但寫了之後, 一直沒寫下文, 因為我就進入了長達半年的低潮期, 這段時間我並不是真的沒寫文章, 甚至還有一篇不小心刪錯的, 其中我最想寫的是 2010 年我對 3C 產品的使用心得總結, 但最後還是沒有寫, 而此時突然想起這篇文章要寫, 就隨著衝動就寫吧.

我一直說我不是個好學生, 因為大概從高中時代開始, 我就一直很少上課, 即使人在課堂上, 心也不是在老師講的東西, 最大的原因, 是我在國二升國三時發現我必須要花半天到一天才能改變思維, 尤其是數理方面, 要進入這種思考模式, 手上拿著書可能前半天或前兩天念不到 10 頁, 但接下來的三天可以念完一整本, 即使是唸凡異的科普書也一樣, 以當時的能力而言, 說要把所有的學習與學問整合成一個相同的思維還太早, 至少我認為我不是天才, 所以要花這麼多的時間進入學習某種學科的狀況下, 說一天要排八堂課四個科目, 對我而言幾乎是浪廢時間, 還沒開始 Warm Up 熱身就要換個科目了, 說要去改變這樣的教學環境或改變我自己好像都很困難, 因此最後就有自個唸的覺悟了.

雖然我號稱 30 歲以前是個無業遊民, 事實上應該說作的工作連我都不想提起的失敗, 其中有兩個很強的經驗:

1. 因為看不慣中華電信壟斷網路資源, 曾經自告奮勇的去做當時科技為主的立委助理, 但做了兩個月, 我發現我平常是做工程師, 但政治的思維是有段差距, 雖說我大學時期長期從事學運, 但要一直切換這兩種身份對我而言是相當困難的, 所以最後只好辭掉了.

2. 後來我也去某財團法人上班, 想說平常我也是在寫程式, 在那邊也是寫程式, 應該沒甚麼關係吧, 但我在那時是在寫 BBS 程式, 而在 "公司" 寫的是協定與函氏庫, 雖然都是在寫程式, 但本質上是有相當差距的思維模式, 我也認知道我沒有能力去做這樣的切換, 因此離開也是必然的.

再加上有一次的 "賽斯經驗", 我大概就知道我比別人的 "Context Switch" 慢很多, 也就是說一般人說要切換思維模式可能耗損的集中力與專注力不多, 但我在做兩種不同領域的切換時候, 集中力與專注力要付出相當的代價, 所以我大概就知道, 即使我號稱能夠多工作業的人, 但事實上有個前提就是這些事情的思維邏輯都差不多, 不然我是做不來的.

PS. 原下標的時候是 "工作與讀書狀況", 但這邊怎看都不對, 只是已經快到淡水, 就只好換標題後存檔.

2011年1月10日 星期一

新聞與部落格孰真實?

前題: 這次事件大部份的部落客都有自我揭露, 且應該沒有說好話才能去或領錢的對價關係, 所以大部份的部落客都是合法與合理的, 唯一有問題的是出錢單位到底是誰, 目前還是羅生門, 這才是資訊不公開最大的問題..


今天又有爆說 "國光石化" 利用部落客來作 "部落格宣傳", 事實上這件事倒是眾所皆知的, 因為這個是 funp 的公開活動, 在我對部落客的定義宣傳倒是有兩件事要拿捏:

1. 不能有任何條件的對價關係
2. 必須自我揭露


而在這件事中, 應該很明鮮的第二點是有達到的, 必須自我揭露已經是在美國認為這是最低的標準, 也就是說, 為甚麼你有機會寫這篇文章的原因都必須說清楚, 因此我也相信這也是部落客的最低道德標準, 所以我們先以這樣來看, 可以看得出來即使並不是每一篇文章都會在內文明顯標示自我揭露, 但我倒是覺得已經很清楚看得出來作者是被 "招待" 過去的, 因此我對第二點是不懷疑的, 甚至我也挑了幾篇進去看, 在回答的時候也都不誨言直說, 這點應該是沒問題的.

只是第一點的 "不能有對價的任何條件", 這才是最難拿捏的, 對價關係指的是雙方面約定要達成甚麼要求時, 才會獲得回報, 而在 funp 的瘋體驗中, 上面寫了價格 "5000元", 這 5000 元是甚麼樣的錢, 這我倒是不太清楚, 是這個參訪價值 5000 元 (交通費?與禮品價值?)呢? 還是若你寫出這篇文章經過審核? 或無論如何都可以領 5000 元稿費呢? 這我就不太清楚了, 只是我剛看了一下, 並不是所有的這二十幾位都有足夠的群眾, 因此若要每人發 5000 元的話, 基本上不是發錢單位企圖心過高, 不然就是當冤大頭.

畢竟雖然很多事情是自我揭露, 也沒有對價關係, 但通常提供單位或場商或多或少都會期望說好話, 只是若沒有說好話的話, 這筆錢會不會給, 就很難說了, 而部落客是否會為了取得回報而寫好話, 這也是肯定的, 但若是大眾讀者了解這關係, 這就不是太大問題了, 因為畢竟部落客是人, 拿人手軟也是真的, 並沒有多少人真的能夠在這種情形能夠做自己, 除非他已經經驗過很多這狀況, 也就是這所謂的回報他一點都不會介意, 或者是真的很清高才能做得到.

當過記者的人都知道, 這樣的參訪活動到處都是, 只是最後要如何寫, 無論寫或不寫, 最後也是許多考量, 主編的考量, 記者的考量, 業務的考量, 所以最後上次有一篇 "如何買新聞第一次就上手", 這個在媒體倒並不是少見, 尤其是越不賺錢的單位越容易這樣做, 而我通常說, 部落客自己的考量反倒是比傳媒單純, 而我現在看到不少篇文章已經 "讀不到了", 這倒底是因為良心發現, 還是已經完成使命是不得而知.

但我看了這些部落客, 倒是不少人都很支持 "石化工業" 是真的, 也相信 "政府" 或 "廠商" 可以做出一個不錯的 "模範產業典範", 而我看到不少人去這些文章留言版去 "吐槽" 這件事, 這點倒是蠻糟糕的, 因為雙方的論點倒是沒甚麼交集, 畢竟一個支持的是 "石化工業", 一個是反對建在 "彰化沿海", 若要這樣說的話, 好像是在討論 "是否要把台北火車站上面蓋核電場" 一樣, 我相信雙方都不會對這議題花時間, 因此到最後變成一種 "假議題" 去 "模糊焦點", 沒有一個部落客會贊同, 但這也是主辦單位的用心良苦阿.

當然最大的問題倒不是這個, 而是誰去買單的問題, 因為無論交通與吃便當也是錢, 反而伴手禮可能是一直存在的宣導品, 或許任何一個人都拿得到, 但要過去一趟也沒那麼簡單阿, 我倒是蠻想試試看若我這樣寫的話, 過去拿伴手禮會不會被趕出來?

寫到這邊, 這文章真正的題目是到底是新聞真實還是部落格真實, 我是認為就自我揭露這點我是願意出來幫這 2x 位部落客說好話, 雖然這些文章並沒有任何省思與深入了解 (參訪體驗可能就只能這樣), 但都是很真實的遊記, 且不誨言吃了甚麼, 而我相信大部份的記者也不會公開記者會拿到的小禮物, 但這是兩件事, 因為這些小禮物還不足夠成為對價關係的條件, 也不會有記者真的被這些收買, 且大家都知道若沒有這些小禮物並不是記者不會報導出來, 而是會不會去的關鍵, 只是這件事跟真實與否也是兩件事.

只是說到國光石化是說到我痛心的地方, 因為有看我文章的人就知道, 有一篇講言論操作, 我很不想講的某間公司用的某個案例去自豪的就是這件事阿, 而現在已經爆出來的話, 應該不能說是我去爆料的吧, ... 雖然我也難辭其疚阿...

(原圖取自於 Funp 工業局這場商的活動介紹, 在原活動網址)

2010年12月30日 星期四

如何選擇 BSP

因為部落格百傑的朋友, 問我要如何選擇 BSP 呢? 她簡單寫了幾點做開端:

1. 服務多元化
2. 活動吸引度
3. 部落客回饋力
4. 系統穩定度
5. 主客互動性

當然上面這幾點都沒問題, 而之前這樣的題目我也寫過, 但經過了四年思維應該多少會有些不一樣:

1. 系統穩定度:

以現在的角度來看, 系統穩定度可以說是占 50% 以上的考量點, 雖然這可是可以很客觀的衡量, 但現在並沒有人持續的去做追蹤, 或許這也是該做的事.

2. 功能完整度:

當然一個 BSP 要有足夠好用的功能讓你想要留在這個 BSP, 因此基本的功能要有, 只是這個基本功能往往會因為時代的關係一直增加, 是一個無法停下來的工作.

3. 彈性自由度:

所要做出所有的功能也是不太可能, 因此也要提供足夠的彈性與自由讓使用者去做調整與強化自己的部落格, 畢竟經營部落格不是關起來經營的, 是一個須要開放及吸引對應的人過來.

4. 活動互動性:

一個人寫部落格有時是很寂寞的事, 因此要時常舉辦活動讓部落客能夠有話題與吸引力來讓整個 BSP 氣氛更活躍一些, 就像是夏日傳說當時對 BSP 的貢獻極高.

5. 曝光與回饋:

寫部落格主要也是讓自己及讓朋友以及讓大家來閱讀, 能否有機會獲得更多的目光, 甚至從閱讀量來獲得回饋來刺激寫作是很重要的事.

6. 社群延展性:

部落格可能是很個人的, 但也可能是很社群的, 雖然 BSP 本身也可能是個大社群, 但也須要許多分化的小社群來去連結, 只是這個社群是用既有的系統或其他系統去做連結, 甚至須要活動的配合, 這也是部落格百傑的一項工作.

當然前五點是比較能夠獨立與完整, 但看起來原本的五點好像也是大同小異阿...

2010年12月1日 星期三

陳致中三點二萬票的反思

在大家認知這次選戰形成的所謂一邊一國後, 一個很有趣的問題, 就是天龍國會問: 那些未開化地區怎會選出這樣的議員阿? 事實上這個在還沒有開票時, 大家都知道他是會選上的, 只是天龍人沒想到幫他助選的是他們.

當決定把陳家趕盡殺絕時, 此時就犯了一些錯誤:

1. 寧願違反一些人權的原則也要關到死.
2. 可以建立雙重標準, 以為大家認為這不是政治追殺.

當然我們知道, 拿黑錢的人不只陳家, 基本上我們都知道在既有的政商黑道掛勾架構下, 天龍人所拿到不得見光的收入遠比敵軍多, 但他們只是認為這是該拿的, 因此在失去政權八年後, 他們對陳家有過於如此的怨念也是可想而之的, 所以在他們眼中稱為 "(天龍人) 失落的八年".

在大部份的人眼中, 用毒蘋果原理或用比例原則來看, 好像這個壞人被這樣的重刑而覺得這不見得應該, 反而對於天龍人這樣的作為反倒是無法接受, 明明天龍人拿比較多, 這些人若是用這種價值判斷的話, 應該關幾百年了, 甚至幾千年, 此時天龍人也就出現一個論點:

"因為此(罪該萬死的)罪犯當時以清廉為號召, 所以罪刑加個幾十等是沒問題的"

雖然稍微說服不少人認同這論點, 但不見得所有人會接受這論點, 因為是誰來決定要加多少倍是操控在天龍人手上的, 媒體也是操作在天龍人手上的, 所以南部未開化的土著對於貴族這樣的決定總是議論紛紛.

我們都知道並沒有多少天龍人有因為收受不正當收入而判刑, 最可怕的是可以用這種政商利益瓜分結構, 隨便掛個董事長就可以光明正當拿個幾百萬到幾千萬, 這才是令下階層人士不了解, 但貴族卻沾沾自喜的行為, 還可以掌握權力的為自己這種特權捍衛, 畢竟他們建立的結構是有是有階級性的, 而每一個有機會往上爬的階級主義者是很支持他們已經獲得的特權, 當然說要動搖談何容易.

事實上天龍人怕的也不只是自己的 "特權" 消失, 更怕有新的特權階級產生, 而這次這個三點二萬票或許在中產階級的眼中來看更不了解, 事實上也是隱含著若放著不管, 新的 "特權" 也會慢慢萌芽, 因為這群天龍人貴族用的就是嫡傳的體系來去架構產生, 去欺騙人民, 這次所謂的三點二萬票說穿了也是這種嫡系理念造成的, 即使這是在他們眼中土著所投下的票, 只是這種選舉制度對他們而言還是可怕的事, 畢竟選票本身是沒有階級的.

所以在事前, 他們可以說是頃全力的把這群曾經占據他們家八年的人趕盡殺絕也不是沒有道理的, 只是他們若能夠冷操作, 冷處理, 或者甚至依法辦事, 或許這結果不會發生, 但他們不會這樣想的, 畢竟他們很難接受一個平民出身的 "公子", 即使火力全開, 到處監聽, 暴料, 反而讓這個第二代真的獲得了光環, 但他們真的沒想到這光環還是他們給他的.

說起來陳公子跟連公子還是差一大截阿, 一個人的第一份工作是不領薪的義工, 一個人是直接當董事長, 一個是直接成為核心份子的常委, 一個還是要脫黨參選, 說起來還真的蠻不公平的待遇阿, 只是在我眼中, 這種事情都是不應該的, 這三點二萬票是不應該的, 而去歌頌連公子的人也是不應該的.

畢竟除了這些人之外, 還有許許多多有能力的人抱持著理想持續做社會工作的人, 而這些第二代, 第三代幾乎不努力就收獲這種光環效應, 對這些人情何以堪阿, 而即使這是事實, 但我是不會把票投給這些人, 因為若我因此而做這種事, 說是共犯結構過於誇張, 但卻事實是冷陌的助長者, 所以即使會有人說沒必要, 但我還是寫出這篇.

2010年11月26日 星期五

給第三政黨一個 30 元的支持吧....

我知道很多人不想投票, 我承認我也是很接近這樣的狀況, 但我還是會去投票, 因為我想要把這 30 元花在刀口上...

當然會討厭現在的政治狀況是對於目前兩黨過於 "惡鬥" 的反彈, 因為在雙方政營中, 都有其立場, 若失去立場會讓自己陷入不是很好的局面, 即使對方多少還是有一些道理, ...

雖然我們也知道, 要轉變台灣的兩黨政治談何容易, 但不代表我們不應該以行動來表示, 所以若是你認為你是在這兩大政營外較為中立, 對於這種對立的氣氛不是很贊同的人, 請投第三政黨一票.

選舉補助款一票 30 元, 對這兩大黨說實在的是杯水車薪, 但對第三政黨這 30 元比這兩大政黨都要來得更大, 即使可能以高票落選, 但若能跨過門檻拿到這 30 元, 我們對台灣政治的未來就跨出一步的貢獻.

所以無論你是支持親民黨多一些, 或是新黨多一些, 或是台聯多一些, 或是要給與綠黨更多的掌聲, 即使在市長候選人無論如何都是兩大政黨競爭的情型下, 市議員選舉請多給第三政黨一個 30 元的支持吧, 讓他們知道, 台灣不是只有正反意見, 還有很多可以理性討論的空間, 更多元的思考, 很多事情沒有那麼兩極絕對化, 沒有那麼 "狂信", 沒有那麼 "教條"...

因此, 市長無論你是投給民進黨或國民黨候選人, 市議員請給第三政黨多一點空間, 讓台灣多一些不同的聲音, 因為這更有可能更接近你的想法.

P.S. 若能夠有當選的話, 那就太好了..

2010年11月11日 星期四

聽取民意 vs 輿論控制, 參與討論 vs 言論操作


很少在標題直接破題的, 因為說當天要寫的, 一晃眼又過了一個月, 雖然現在是比較心平氣和的看這件事情, 但有時還是會有點無奈.

這件事是發生在某個研討會上, 而大家都知道部落格觀察或部觀門都是看誰說得好, 大家在說甚麼的系統, 包含之後的 Plurk.tw, 我一直對於 Data Mining 與這幾年開始玩 Text Mining 有某種程度的執著, 當然以我對社會的理念而言, 希望的是透過這樣的系統去知道大家在想甚麼, 進而參與討論, 但並不是大家都這樣想的.

當然我在前面的文章就說過, 聽取民意與輿論監控在技術上是沒有差別的, 而是在於心態, 而參與討論跟言論操作也是一樣, 都是在發文與說話, 但在乎你是用甚麼樣的角色.

因為那一天我在會場, 聽到許多高官在位者, 以及商場的總經理與副總經理, 在教大家如何創造假帳號, 製造一個不存在的人, 去影響與引導大家的討論, 還很沾沾自喜的說這才是最正確的方法的時候, 雖然我的表情看不出來, 但我那時候真的很想翻桌.

幸好我那天沒有寫這篇文章, 不然我一定會把這些人的名字給供出來, 且那時候大家就知道我參加甚麼樣的會議, 只是現在想想, 有這樣想法的不是那幾人或那些人, 而是許許多多在這年紀的人, 在那個位子的人, 已經混淆他們的人格與角色, 雖然他們希望網路能夠真實, 但他們的工作卻是在創作虛假的內容, 而為了將自己的工作合理化與正義化, 在一面鄙視網路的虛假, 自己也正在做相同的事.

網路的言論自由, 不是用來給那些人來操作言論的, 言論自由用意是為了讓每個人去表達自己的立場與意見, 而不應該因為其言論而危及自己的角色, 也就是說每一個人都是平等的, 無論你是甚麼樣的人, 但在那天聽到 "為了取信於人, 假造自己是某個 XX 大學的 XX 教授來讓人信服", 這跟本不是言論自由阿, 而是另一種權威的壓迫.

也就是他們一心的只是想要輿論控制, 言論操作, 跟本無心聽取民意或參與討論, 認為說出真實會危及自己想要宣傳的, 就想盡辦法去扭曲與掩蓋, 即使那不是自己誠心的, 而說: "我只是對自己的工作負擇, 每一個人有自己的立場", 這樣跟馬先生說: "每一個時代都有該做的事" 這樣一語帶過不是一樣的嗎? 把自己該有的責任推給工作, 推給時代, 推給說: "為了更好的下一代, 為了更崇高的理想", 但難道他們不知道他們已經吃下毒蘋果, 這種種子會蘊孕出甚麼樣的未來是可想而知的.

暱名, 只是不想以言舉人, 以人舉言, 以人廢言, 以言廢人, 暱名, 並不是不存有一個人有這樣的想法, 而是更強調可能有一群人有這想法, 而是倒底是那一個人不重要罷了, 也是說有須要時, 我們甚至該站出來行動去代表自己.

甚至在網路, 暱名只是一種身份的轉化, 並不代表隱藏自己, 或是個人不存在, 而當暱名用在想要作言論操作, 想要輿論控制的話就不應該了, 甚至我在推動BBS個人版, 個人部落格的觀察, 目地是要証明個人的價值與存在, 自我的呈現與體驗, 因為唯有透過持續的發表, 才能建立真正的網路人格, 價值才會提升, 就像是我在部落格大講論壇回答的第一個問題: 部落格無論再怎商業化, 政治化, 我唯一希望的是大家保持真實面, 而讀者也應該去判讀或閱讀真正的真實, 而不再被包裝, 廣告, 行銷, 宣傳帶著走.

最真實的意義是: 我們是一條狗又如何, 因為我們自己言論的真實, 比那些名片職位很漂亮的長官卻不敢說出自己真實想法的話更有價值, 但更要警惕自己的是, 那天我們真的坐上那個位置, 還是否能夠保持真正的自己, 還是在那時我們也失去了自己, 或許這也是我希望大家努力的寫出自己想法, 對於公眾事務能夠有自己的主見, 相對的, 我們也不能因為他說過的話去確定他的現在.

就像我今天遇到一個同事, 他說他最後也是用自己的身份去發言, 或許以後這些事情會成為問題, 但這才是對自己與成長負責, 人要努力當個自己已經相當不容易, 還花時間去假造自己, 這真的太悲哀了.

P.S. 圖譯: 在網際網路, 沒有知道你是一隻狗.

P.S. 最下面是某公司那天在場的投影片, 雖然是公開的, 但我把公司名蓋起來了.....

2010年9月23日 星期四

網站經營的行銷方式, 以我的 eGOV 為例..


虛擬在網路空間的網站跟現實社會實體的房子最大的不一樣是: 一個店面或一個單位, 在一條路上無論如何只要從經過的人潮就可以知道他會被多少人知道, 只要招牌或門面做得夠大, 無論如何都會吸引一定的目光達到一定的效用, 有時甚至不用去做宣傳與廣告本身就有一定的知名度與人潮, 但網路空間的網站不一樣, 不像人潮會有 "經過" 的效用, 網站直接一點就可以到了, 若你沒有去做行銷與曝光, 是完全被 "淹沒" 在千萬個網站之中, 不會有任何人造訪, 即使你是花多少錢, 上千萬的預算去打造網站, 沒有人來就是沒有效用.

說網路行銷跟傳統行銷又是一個不一樣的東西, 並不是說用的是不同的技術, 不同的媒體, 而是在估量效用上的不同, 也就是網路行銷最有趣的是可以去 "監測" 出每一個管道的效用, 也就是所謂的 "轉換率" 上的差異, 在傳統的媒體去做網站行銷並不是不對的, 而是在轉換率上有很大的差異, 例如你在電視上砸下大量的金錢做宣傳, 不只是你不知道有多少使用者看得到, 甚至使用者看到有印像後, 要打開電腦去使用有很大的落差, 不只是說每一個人看到的成本很高, 甚至因為這樣的轉換率相當低的結果下, 真的人潮會進來的成本又更高了.

轉換率不只是最大的問題, 事實上不同的媒質雖然看起來是大同小異, 但網路最重要的是在於 "互動", 因為網站不只知道有誰會進來, 甚至怎麼進來, 進來後能夠做甚麼, 甚至之後他是否能夠再次傳播或幫忙做口碑行銷, 這是網路行銷跟傳統宣傳最大的差異,甚至是說, 一個無法幫助使用者做輕易做到二次行銷的網路行銷案, 以現在的觀點都是失敗的, 舉個例來說, 使用者當體驗完這活動後, 能否在一個滑鼠點擊就能夠輕易的讓他在人際網路系統上提出自己的經驗讓他朋友知道, 例如是 Facebook 或 Plurk, 再者更甚至是在部落格寫作, 不只就既有行銷能夠到達 (Reach) 到他, 甚至能夠透過他來做口碑, 這是網路行銷最大的不同.

只是這幾個問題都是取決於對像的差異, 若是討論到電子化網路政府的考量點更多了, 因為一個電子化政府不只是接觸到既有的網路族群, 更須要扮演幫助與延伸的功能, 除了 G2C (Citizen, Customer) 外, 還包含例如:

G2A: Association 對於非營利組織上的協助, 尤其是壓力團體之間的互動更是須要考量到.
G2B: Business 企業單位用的管道跟對民眾是不一樣的, 在功能上以及方法上更是跟民間不一樣.
G2D: Disadvantaged 一個網站經營者可以不用太考量到不會使用網路的人, 但政府不能不考量到.
G2E: Employee 在企業裏面可以說是 EIP, 但政府單位人員之多, 執掌之不一樣, 在單位之間的互動複雜度是相當高的.
G2F: Foreigner 除了國內的使用者的應用外, 甚至在對外的宣傳上都要去建立其管道.
G2G: Goverment 甚至在跟各國, 或者是各自治單位的水平與垂直聯繫上都須要有人去推動.

所以從對像的不同來看, 不只看的是行銷的族群不同, 對像不同, 所以用的方法, 媒體, 內容, 也會隨之不一樣, 甚至有些不只是轉換率要如何提升的, 而是應用率要達到 100% 百分之百才是對的.

網路政府能夠做甚麼? 這篇文章中我提到三個方向, 主要是從 G2C 的觀點來看, 來強調其應用性, 透明度以及互動, 除此之外, 網路政府的行銷更應該不只是應用網路的 SNS 來達到轉換率 (Transfer Rate) 更高的社群與工具來使用, 就台灣而言, 當然是以 Facebook + Plurk + Blog and Mobile 為主, 甚至找的代言若是找這些媒體原生的知名人士,而不是用傳統媒體的藝人來做代言, 會更有親和力與說服力, 事實上每一個媒體與媒質用的語言與方法都不一樣, 本來就不太可能混為一談的.

甚至不只找的代言人不一樣, 更者一個好的網路行銷公司須要的經驗事實上跟傳統媒體是完全不一樣的, 不只是互動性, 監測性, 就像是一個網站經營者一樣, 你今天要如何經營一個網站就必須要具備基本的網站管理者 (Webmaster) 的知識, 知道須要使用那些工具, 再加上不同的 SNS 有不同的應用與對像, 不同的語言與方法, 操作上也有很大的差異, 說要只靠 "創意" 來作網路行銷是不夠的, 更重要的是透過 "經營" 知道的你的群眾在那裏, 透過一步步的經營能夠達到更多的人, 這才是一般行銷人最沒有經驗的一環.

今年來看, 我的 eGov 跟往年比較起來, 已經會應用 SNS 來做行銷了, 也有在用一些 Facebook Application 臉書應用程式來幫忙做行銷, 真的是有在進步, 若是明年的話, 應該進一步的把功能更開放 (Open) , 讓使用者把這實用的功能去 mesh-up 到自己的空間, 無論是 SNS 或部落格, 這樣會有更直接的行銷效用, 也能夠讓功能有進一步價值的提升.

這篇文章是我朋友在做這其相關的業務, 問我一些想法, 我想與其講出來還不如寫出來好了.

其圖片是取自於 http://www.egovonline.net/

2010年9月3日 星期五

如何到吉美凱洋

這一篇是寫給要來我家的朋友...

到我新家來借宿有幾種方式, 一個是搭船....

1. 主要是搭任何一艘船, 能夠在淡水碼頭上岸的話:

就可以用走的走到我家...


上圖的 A 與 B 是相反的..

雖然上面是寫 13 分鐘, 但事實上有 10 分鐘都是在漁人碼頭晃, 走出來不到 5 分鐘就到我家了, 是個不錯的路線 ....

2. 坐捷運轉公車到我家, 最主要就是坐車到捷運站, 然後搭乘任何到淡海或漁人碼頭的公車...
例如:

紅 26


或者是班次較多的淡海板橋


這兩班都在淡水拖吊場下車, 走兩分鐘就到了..

而要直接在門口下車的只有在停 "油車口停車場" 的淡水鎮民免費公車, 但這個比較少, 但走不到 20 秒就可以...

當然還有 836 的淡水古蹟公車, 就有油車口停車場, 這更走不到 10 秒就可以了...


3. 不然就是開車或騎車:

只要開車往漁人碼頭的路上, 過紅毛城後不是要左轉嗎, 而你不要左轉就可以直接到沙崙路與中正路二段, 事實上更近阿......

所以你會選那種?

而詳細地址還是私底下問我吧...

2010年8月30日 星期一

從兩種遊戲策略來看兩種生命模式

有在玩策略養成或戰略戰術遊戲的人都知道, 路線再怎麼多, 但整體而言有兩種觀點:

1. 平衡型, 就資源, 科技, 軍事三方的發展都要均衡, 攻擊防禦也要均衡, 各項屬性都要保持一定值, 這樣就可以立即對任何挑戰去回應, 不怕對方的侵略, 更不怕遇到瓶頸, 一下子就往勝利邁進.

2. 極端型, 在避免陣亡或掛掉的情型下, 一開始只發展資源, 或者一開始就衝攻擊, 或者一開始就衝體力等等, 然後在一定的檢核點 (Checking Point) 拿下勝利或最高分, 之後再把弱項補足, 這樣就穩居不敗之地.

這兩種策略那個好那個壞是沒辦法有定論的, 一個我稱為 All the Time, 在均衡發展下, 通常都不太會出問題, 而我另一個稱 Just in Time, 也就是總是在最後一刻才解決掉陣亡結束的危機, 當然若是這兩個人對戰的話, 可能 10 場中有 6 場是 All the Time 的人獲勝, 但若這是團體戰的話, 最強的團隊可能是有 6 個平衡型的人加上 4 個極端型的人才能組出最有趣的團隊.

當然一個有好的 Game Quotient (遊戲智商) 的人, 能夠在最短的時間內判斷在那個時刻要用那種策略以及發展那種角色來去獲勝, 一個好的遊戲一定有足夠的平衡點讓所有路線的人都有機會獲勝才會有趣, 而一個好的遊戲也必然的讓每一個玩家發展出自己的長處, 然後也會讓任何策略有其優點或缺點.

所以有時常常可以從遊戲來看人生是真的, 但不一樣的是遊戲會玩完, 很快就會在重來, 但生命不會, 你要如何在這場 "人生遊戲" 中, 很快的判斷出你該走甚麼策略, 一個平衡型? 一個極端型? 以及甚至要考慮更多的是要跟那些人組成團隊, 而你這角色在這團隊中扮演甚麼樣的地位.

有些團隊合作遊戲一開始就會作設定, 就像是 "瘟疫危機/Pandemic", 一開始就讓你知道你是科學家, 行動家, 指揮家種種的角色, 而像 "波多黎各/Peuto Rico" 很快的就從每一個階段的發展方向, 就知道你是生產系? 上船系? 建築系? 就像是 "Race for the Galaxy/銀河快跑" 一樣, 你參考你拿到的算分方式, 就可以猜出來你該走甚麼就能夠獲勝.

但生命確是不一樣, 沒有人知道這 "生命遊戲" 那時候要 "Call Game and Score/結束遊戲算分", 甚至要怎算分都不知道, 更何況你不知道你會拿到甚麼樣的牌, 走甚麼樣的路線對自己是最對的, 所以我常常都勸人不要做 "生涯規劃", 因為沒有人知道未來是甚麼, 而你現在更要專心的是從手中的牌中打出好牌, 不要去期望說: "阿, 若能夠這樣/拿到這張牌就好了", 而真正的人生是要看自己的能力, 自己的個性中找到自己的生活與生命模式, 甚至算分模式都可以自己決定.

當然說只有 "算命師/預言家" 才能做生涯規劃是過於言重了, 並不是叫你不要看未來, 而是要更專心自己的現在, 而有時我通常說, 要看一個人的個性以及本質, 才能夠知道一個人該走甚麼樣的路線, 甚至這兩條路線也有一個決策點, 就是你 "Context Switch" 的成本....

而這篇是剛好今天早上做捷運想到要寫的, 且又剛好看到 "Context switch in a Sprint?" 這篇想要回應, 但好像還沒提到重點, 就換下一篇再說...

[上圖取自一個非正式的 Race for the Galaxy 的擴充, 不知道誰有玩過?]

2010年8月23日 星期一

噗熱浪官方說法前後 -- 回應不實指控以及關心事件發展的噗友

我昨天寫那篇, 就假設這是給一些技術人來看的一小段文章, 再加上自己的許多苦水吐一吐, 無法成為正式的官方聲明, 但這不是只有我一個人的事, 所以我在還沒官方處理之前先自己來澄清, 很多人說看不懂是真的, 以下是節錄聲明的前面一段:

事實的真相


  我們必須聲明,噗熱浪絕對、從來沒有以該網站所 稱之方式,進行所謂竊取的動作,在噗熱浪上的所有熱門轉噗網頁記錄,都是經過我們自行開發的程式所計算出來的結果,絕對 不存在所謂「接水管」的行為,我們也不能接受如此的指控。那麼,誤會是如何造成的?

  的確,我 們的程式曾經造訪過該網站,但絕不是全面性的抓取該站資料。由於在噗熱浪網站會對被轉噗的網頁進行和搜尋引擎類似的內容 摘要動作,並且對其內容作分類,以便在噗熱浪上讓網友有更完整的參考資訊,這也是噗熱浪目前和該網站最大的不同之處。因此當噗熱浪計算的熱門網頁中,出現 該網站之網頁時,程式便會前往造訪該網站,並進行網頁部份內容摘要,這個動作在程式裡對所有網頁的處理是一致的,並沒有針對性。

  也就是 說,該網站提出的證據是真實的,但並不等同於噗熱浪去盜取該站資料,只是該站的網頁被轉噗了,程式就會前往造訪,用意絕不是盜取那些資料,然後放到噗熱浪 上來。更何況,以這種方式獲得的資料量,和目前噗熱浪所處理的資料量,差距很大。相關技術說明,可見噗熱浪技術顧問所提出之說明 http://geneoralspeaking.blogspot.com/2010/08/blog-post_22.html

當然我上一篇有人叫我只寫下面一段就好:

因此所謂這 7000 筆抓取, 就是 Plurktop 的網頁與網站被推噗 (且進資料庫) 的網頁數, 而我們是去抓這網旨的標題與內容去做分類..
這兩段事實上是大同小異的...

當然最後剩下來討論的是 "OK, 你們即使不是接水管的 Backend 的資料來做的, 但你們還是有來抓資料, 這個不是應該打招呼或事後道歉嗎? " 這樣的議題, 例如有人說: "不要把人當笨蛋了,你爬mmdays的資料還沒跟mmdays道歉... 如果說人家摸你東西你無所謂,不代表你摸人家就ok 模糊地帶本來就該以和為貴..." 出這樣嚴重的事, 當然我說我當然願意道歉, 只是我剛看了一下, 我這個部落格也被爬走了標題, 這樣是否他也該發個道歉啟事呢?



我很肯定這不是從我的噗抓到的, 因為我的噗沒也截圖, 原標題寫的是: 我原本很不想回應的, 但後來討論了之後還是得澄清一下 這樣的字句, 不用看 Log 也知道他們有來爬我的網站, 雖然這又拉回來了, 會不會是雙方在五十步笑百步或者這只是雙重標準呢?

(上面的截圖取自於 Plurktop, 但未經過同意, 所以我在此抱歉, 也希望對方對於此行為道歉?)

但這個是小事, 因為這種誤會說清楚就好, 就怕會有高道德標準的人開始延續戰火, 但這也還好, 最大的問題就是善後...

記得前一陣子有個姓邱的名嘴說過: "只要爆料的事情, 十件有一件是真的, 就對社會有意義, 更何況他是每十件有兩件是真的", 當然這句話是沒錯啦, 但比較可憐的另外八件事的苦主被冤妄後, 名譽受損, 工作丟了 , 家庭失和, 還付出一堆慘痛, 但唯一的作法大概只能在地上畫圈圈, 而邱先生大概只能說: "對不起, 為了這社會好, 你這犧牲是有代價的"...

我剛去噗浪河道看了一下, 未經過認真統計作了這樣的分析:

30%: OK, 我相信噗熱浪的確不是去接水管, 這件事是誤會.
20%: 看不懂你們兩方在說甚麼, 純看熱鬧.
10%: 雖然我知道大家在說甚麼, 但是否有更高的道德去保障甚麼呢?
40%: 你們噗熱浪好糟糕阿, "需要的結果一樣,所以直接偷接"

雖然就數字上來看, 有 4 成的人已經接受噗熱浪的說法, 但還是有相對應的人信任 MMDays 與 XDite 的說法, 因此看得出來他們真的具有很高的影響力阿....

因此我相信最後他們即使願意澄清, 但我也只好去趕緊找塊較大的地來畫圈圈了.

PS. 雖然這不是甚麼 "作賊心虛", 但應該會把 Plurktop 的 IP 封起來, 雖然他們被不少人推噗, 即使想要保持資料的完整性, 但別人不想要的話還是要尊重別人, 因此若是他們的網頁若是進到排行榜, 就來弄個 : "這個 Plurktop 的網站的標題不想被人抓" 的標題好了... 呵呵.. (這句話是亂入)

2010年8月22日 星期日

對自我產品的信心

有時我總對自己做的東西沒甚麼信心, 從 Plurk.tw 一直到做了很多延伸的應用, 尤其自己知道美工排版不行, 所以常找人合作, 其中一個東西就是 "噗熱浪"...

事實上 Plurk.tw 比 Plurktop 還早做, 當然我們這邊只能從發文說開始運作開始的日子, 因為噗熱浪目前還在 beta 的 beta, 還沒開始說...

2009/06/20 推噗排行榜發 佈 (Re-Plurk)
2009/08/11 PlurkTop 轉噗排行榜 – 挑戰如何找出 Plurk 上最新熱門話題

我相信知道 plurk.tw 的計劃的人, 知道 plurk 熱門話題的方法做了很多, 比 6 月 20 前做的更多, 但最接近的是這個了..

而我很配服 plurktop 的人, 畢竟這是個吃力不討好的工作, 所以我做了一下, 就想說把這資料匯出去用不同形式的方面去呈現, 即使是相同的東西, 不同的介面也是會造成不一樣的結果, 因此跟本這沒有誰抄誰或誰先發想的問題, 因為做過系統的人知道, 想法與創意有時跟本不值錢, 真正的是執行力..

當然我知道 MMDays 他們對自己做的東西相當有信心, 我也認為有相當的價值, 因此對於會覺得別人去抄他們或所謂介接資料比較敏感是真的, 像我就一直把我產出的資料當作是 Public Domain, 畢竟這不是我原生的, 我只是去觀察大家行為所產生的, 不認為自己該有任何權力, 自然被人抓我也不會覺得如何阿, 但我也知道我的想法只是少數, 沒必要去要求別人...

所以看到 MMDays 這樣說, 我也只是笑笑, 這只要說清楚就好, 即使最後發現是誤會一場, 我也不會叫 MMDays 說甚麼的, 雖然我當時看到:

所以,癮科技,我們的要求如下:

  1. pp.cool3c.com 立刻關站 pp.cool3c.com立刻停止從plurktop撈資料
  2. 在 engadget blog 上面立刻公開道歉,道歉文必須是置頂文三天,並公布事情經過,說明是誰做出這樣的事情
我直覺是想到要不要對賭一下, ..... 嗯, 這是開玩笑, 畢竟我也是老經驗了, 知道這種誤會的事在所難免, 沒必要弄成這樣子, 但我唯一覺得心情不高興的反而不是 MMDays, 而是 XDite, 因為她第一時間就在自己的部落格寫了一篇, 且相當有自信的就這樣 "合理的懷疑", 害我愣住了一下 XDite 怎可能沒看到一句話:



有一個來自 76.74.155.106的IP,從三個星期前開始,幾乎定期上來撈Plurktop的頁面,幾乎一秒鐘一頁(哪個人看網頁這麼快?)有時一天只撈30 次,有時一天撈200次,前後下來已經撈了七千多次。

看到這句話也大概知道這系統該如何完成的人, 知道 3 星期 21 天撈 7千次, 也就是每天撈 350 次網頁, 要從這邊組成 "噗熱浪" 真的不太夠阿, 因為這平均每天 350 次資料, 真的是說 Plurktop 每天至少被轉噗了 350 次阿, 這代表 Plurktop 的確是夠有價值被轉噗, 即使扣掉自己的機器人也不會少多少, 所以我在這邊是很訝異 Plurktop 真的很不簡單阿..., 因此所謂這 7000 筆抓取, 就是 Plurktop 的網頁與網站被推噗 (且進資料庫) 的網頁數, 而我們是去抓這網旨的標題與內容去做分類.. (因為噗熱浪有內文關鍵字判斷分類的機制).

只是這 7 千次, 是占我們 4百50萬筆資料的 0.16% 阿, 目前已經掃入的網址大約是這數字, 下圖就是已經抓到還沒有處理過的原始資料, 因此, 有真的做過這種轉噗系統的人應該知道, 不可能靠這麼少筆資料來組出這樣的東西, 因此連我處理都很頭痛了, 而 Plurktop/MMDays 他們雖然抓的噗浪使用者數沒有 Plurk.tw 多, 但我也知道這是相當不簡單的事....



也是因為這樣, 難道 XDite 相信我的能力以技術只靠這 7000 筆資料能夠推算出更複雜的資料, 這樣真的是過於高估我了, 因為我還是很白癡的一個噗一個噗去分析 (Parse), 事實上每天 Plurk.tw 大約是每天抓 150 萬~ 250 萬次的資料才能組出來的, 即使我不辛苦, 我的程式或我的機器人也很辛苦的, 請大家可以誤會我是懶惰的人, 事實上我也是.... 但千萬不要認為我的 Server (伺服器) 很懶惰阿... (但還是有時會鬧情續罷工)

所以我相信 MMDays 以及讀者應該會了解了, 但就我之前的經驗就是 XDite 的讀者以後會一直傳, 然後見到我就問: "聽說你抓了別人的資料 backend 來當自己的網站阿"... 這才是讓我覺得煩人的地方阿, 因為 XDite 肯定早就認定我是這樣的人, 真慘阿...

Anyway, 請大家若以後抓我的資料/文章/程式是完全不用過問我, 也不用說是我弄的, 這句話我已經說過很多次了, .. (唉, 但好像會來找我要資料的人是不會看我的部落格的)...

2010年8月10日 星期二

網路政府能夠做甚麼?


網站這種東西, 看起來很偉大, 事實上能做的事很少, 甚至說穿了, 就是只能處理有關 "資訊流" 的事, 只是這個 "資訊流" 是可以說大很大, 說小很小, 甚至在 EC 電子商務網站的三流: 金流, 物流, 資訊流, 若沒有了資訊流, 即使有好的物流與金流一點用也沒有.

在政府網站的網路政府, 能做的最基本工夫就是把這個 "資訊流" 的價值完成, 這價值可以從三方面來看:

1. 政府資訊的公開化: 美國歐巴馬政府在網路最大的宣誓就是成立 Opendata.org, 把所有的有關政府資訊公開, 事實上若是政治是眾人的事, 事情必須被顯示, 資料要提供判斷的準則, 所做過的事要被記錄與稽核, 都是必須把所有資訊給記錄下來, 並給予公開, 事實上, 很少資料是會影響國家安全的, 反而絕大多的事情都是政治考量, 而這些有關 "眾人的事" 若只被少數人知道與把持, 甚至是操控是相當不健康的, 因此把政府資訊盡可能的公開化, 是網路政府第一個課題, 至少這部份應該從國家機關, 議會, 地方機關開始作起, 然後遍及所有公營單位及組織, 尤其對生活有直接影響的如交通資訊, 應該優先的把這資訊流給打通.

2. 人民資訊可被傾聽: 政府是處理眾人的事, 但若不知道大家的想法, 如何去判斷與決策出最好的答案呢? 因此除了政府要有專職單位去發布政府的所有事, 相對的也要有專職單位去搜集與公開輿情, 以這個於民意做為決策支援系統, 甚至具有即時公投以及群眾討論的空間, 就像是國外已經確立 "網路權" 是人權一個很重要的事, 這網路權指的就是人民可以自由的發聲, 即使須要自行負責但也不能被限制.

3. 政府與人民的互動: 有了政府到人民, 人民到政府公開, 透明的資訊流之後, 接下來的就是看這資訊流能夠做甚麼, 像是一些公共行政事務更是可以直接在網路上呈現與實現, 一些申請的資訊流, 或者是直接做投票的事務決策, 人民與政府能夠透過網路做互動, 甚至是直接在網路實現議會或做決策, 不只是讓眾人的事能夠讓眾人決定, 甚至是讓大家的參與能夠更多.

現在最大的問題是:

1. 雖然很多政府網站提供對政府的意見與提案, 但這些往往都不被其他人民看到, 討論, 以及知道政府的解決狀態與方式, 還是處在一個封閉且單向無回饋與群眾互動的機制.

2. 沒有一個權責單位去搜集與發展這公共資訊流的事務, 這畢竟是須要主動的專業專門單位去把這功能強化, 畢竟要既有的單位去補足是不夠的.

在 20 年前我投身網路是認為網路是民主的最後一道防線, 但 10 年前我慢慢發現網路變成民主的先峰, 但現在, 我反而覺得網路是民主的主軸阿...

2010年8月9日 星期一

「.tw」改「.台灣」 矮化中國一省 ???



這篇報導是在 http://tw.news.yahoo.com/article/url/d/a/100809/11/2ar0a.html 這裏, 到中午, TWNIC 的人就一直打電話給我, 而我還在會議中搞不太清楚是甚麼, 但就大意上面指的都是講了很多有問題的話, 而我一上網看, 果然問題比我想像中的還多..

1. 首先 .tw 並沒有 "改成" .台灣
2. 香港也沒有申請變更, 也都是新增 .香港
3. 沒有人知道當時的狀況, 而說成是 twnic 申請被修改 (事實上我在昨天也說了三次不知道)

當然 TWNIC 緊急 call 我的原因是責怪我怎沒跟他們講, 但就我所知道的是東森在 8/4 之前就在跑這新聞, 而我聽到時, 趕緊聯絡國際事務的白理事, 但後來才知道他剛好小孩在出生正忙, 這也該恭喜他, 所以我想應該他們會找其他聯絡窗口, 但 TWNIC 理事長跟我講一件令我震驚的事情: "TWNIC 完全沒有收到東森的任何聯絡與通知, 反而只有自由時報, 且已經擬定三點聲明", 還在運作的過程中, 驚見這新聞阿...

原本這新聞不應該是我去跟東森解釋的, 因為這是喬敬他們先知道有人抗議的, 而在昨天緊急的找我去錄影, 是因為找不到人才代打, 所以我在父親節當天從淡水來回, 花了 5 個小時沒有半點車馬費, 也是衝著我們應該把這件事情給大眾知道, 只是以為東森應該會很有本份的作平衡報導, 最後實際上並不然....

因為我本身並不是對 "台灣" 這字有很強的基本堅持, 尤其我是比較偏無政府主義的人, 寧願多花一點時間對網路有點貢獻, 尤其是這次 TWNIC 的問題, 在我眼中倒不是他們, 而是 NCC 或郵電司甚至是外交部的問題, 因為網路有趣的地方是大家都可以努力與貢獻, 而我們知道國家給我們的資源太少, 如此我如何信服大政府架構呢? 還不如相信無政府比較直接, 自己做比較快...

而有太多網友在這邊發聲與著力比我多太多, 我在這邊只能只是個插花, 而要解釋給媒體聽是沒問題, 但看到這樣的報導, 我只能又對媒體的分數又要調整了...

2010年7月2日 星期五

總統府網站分析 III (安全性)

總統府網站雖然相較很多網站並不是那麼重要, 但也因為其特殊性以及政治立場的角色, 是很容易一直被拿出來討論的, 至少這幾天就 Alexa 的觀點來看, 從 3000 名外進到 3000 名內 (見右圖), 流量也瞬間多了四倍, 也可以當作是一個小型的壓力測試了..

至少這段時間也超過內政部與法務部, 感覺起來似乎有點全民網站的味道了, 不會那麼感覺是馬總統粉絲站, 而不是總統府網站了, 所以這七百萬也花得挺有用的.

但話說回來, 一個網站就安全性來看有兩種層面:

1. 該看的人都能看到該看的東西
2. 不該看到的東西被看到


至少就 High Availbility (HA) 的 Load Balancing 等等的機制應該是沒話說, 聽說以前是用 F5, 而這次是不是有換掉我就不知道了, 但應該不是用 Redundent IP 來實作是真的.

而要做多少的壓力測試 (Pressure Test) 我是沒意見, 至少在目前沒掛過的情型下應該是及格的 , 或許至少在沒有被 DOS 或 DDOS 之前是無法真的知道的, 雖然我個人對這套系統是擔心多於信心.

但下一個問題是, 真的有沒有不該看到的東西被看到.

當然就正式與非正式的小道消息知道, 總統府網站的確有做過 Static Code Analysis, 也就是所謂的 SCA, 這個至少避免了許多常見的問題, 包含 XSS, SQL injection, BOF, ... 等等的基本問題都被測試過了, 甚至小道消息是也不少人做了不少嘗試, 最後目前 "只" 發現這個 Explicit Parameters 的 Error Text Handling (ErrTxt) 錯誤訊息處理問題的問題.


因此最後有了這張圖與其 "呼叫網站"....

這篇文章也說個大概, 但實務上我知道有人做的 "嘗試" 遠超過如此, 但也真的只有這樣, 所以我也經過管道也確定有做過 SCA, 但也承認這個問題是 SCA 目前無法直接找到, 是屬於系統設記的問題, 且這對系統的穩定度與完整性沒有任何損害.

但也絕對因為不是透過 "正常網站" 的瀏灠不造成影響與問題, 就說這系統安全性無虞是接近掩耳盜鈴, 畢竟若這是一個 Kuso 網站若有這樣的問題大家還可以拍手叫好, 但若這個是會發布國家級公告的總統府網站就沒那麼有趣了, 因為這很接近 "看到不該看到的東西" 了.

因此若是非總統府網站, 做到這樣已經是誠屬難得的, 但因為這個角色的特殊性, 這問題也是非同小可, 所以最後還是補起來了, 這也足以對後面的工程師與程式設計師讓我在這邊表達敬意, 這是相當認真與努力的表現, 不然依照我做網站的個性, 只有比較糟不會更好. (所以我才打死不接案子)

拉回來, 台灣有多少網站有在做 SCA, 當然我知道大部份的 100 名或 300 名大網站應該可以假設知名的網站 8 成都做了, 當然這個 3000 名沒甚麼人在看的網站有做 SCA 也是該鼓掌一下, 因為我也聽說之前太多的問題發生, 國家級網站已經把這種滲透性測試及 HA, SCA 當作標準流程之一, 說真的我不得不承認這塊是領先業界, 畢竟台灣小型網路公司還真的沒有資源 (人力與金錢) 去做這件事.

最後要我在這項給總統府網站打分數, 我會給 63 分, 比 61 分來得高, 若不是總統府網站會給 80 分以上, 但這個在這邊是不行的, 只是這分數跟我藍綠沒有絕對的關係喔... (大概吧...)

一個人是聰明的, 一群人是笨蛋

這是一個相當有趣的題目, 這是不爭的事實, 為甚麼我們很常觀察到 "一個人是聰明, 一群人是笨蛋" 呢? 因為理論上我們認為三個臭皮匠勝過一個諸葛亮, 再怎樣一群人的知識與經驗, 不可能少於任何一個人, 因為我們不是常說團結力量大嗎? 但是另一個有名的諺語是: "一個和尚挑水喝,兩個和尚抬水喝,三個和尚沒水喝。", 這大概就說出個大概了.

因為一群人聰不聰明, 不是在於他們一群人的能力, 而是這一群人在一起的共同價值觀, 或是最低道德水準是甚麼, 甚至是這一群人在一起的責任是甚麼都會影響一群人最後的產出.

事實這篇文章要講的不是又要講甚麼總統府的題目, 要講的是: 記者 vs 部落客.

基本上我一直在媒體業, 看過很多記者, 大部份的記者有很高的 "道德良知" 與 "專業素養", 這個幾乎是絕大多數沒有在這職場的 "部落客" 能夠達到的, 甚至可以說 80% 的記者比 95% 的部落客都來得能力好, 只是這個 80% 的記者可能是 1 萬人, 而這個 5% 的部落客是 5 萬人那樣, 但無論如何, 若依這個觀點來看, 媒體的水準是不可挑戰的才對.

但是雖然記者一個人是不錯的, 且通常許多報導是一個人或兩三人作出來的, 但為甚麼有可能會遇到做 "傻事" 呢? 當然這跟報導流程有關, 一個報導的水準不是決定在直接在現場的記者, 也決定在飽經事故的主編, 更是決定在看發行量與收視率的總經理, 以及只看財務報表的董事, ...

一個人有自己的道德觀與價值觀, 但一群人在一起, 採取的不是任何一個人最高道德與價值觀還高的標準, 而是採取任何一個人最低道德與價值觀還低的標準, 所以即使一個人再聰明, 一群人還是會做傻事的, 即使是明顯的社會價值不容, 或者是 "職業道德" 限制的範圍, 因為這一群人通常會有一個人的 "道德觀" 早就被社會化到很低, 甚至是只剩下 "錢" 是唯一的判斷水準.

為甚麼會有這樣呢? 因為真的要在一個會議做出一個共同決策的結論, 採取低標被接受的機會比採取高標的機會高很多, 但理論上應該是會有折中的決定才對阿, 只是事情有很多層面, 不是單一的角度, 每一個人在不同層面都有其自己的高標與低標, 但最後若是每一個層面都是採取低標的話, 就會造成這標準是低於任何一個人, 並不是這一群人故意做出低標的判斷.

再加上主事者與主導者理論上擁有較高的影響力與決定權, 且這一些人可能是這一群人中最低的道德與能力標準的話, 變成即使是真的要做出中間標準的判斷是不太可能, 幾乎是每一項觀點都是最低標準, 再這兩種過程的運作下, 真的可以證明: "一個人是聰明的, 一群人是笨蛋"..

很不幸的, 部落客水準再差, 這 5% 的五萬人, 可能有 5% 的 2500 人 (0.25%) 表現的比 80% 的記者 2500 人還要好, 這還不打緊, 更怕的是經過 "組織" 運作的方式, 大部份的媒體早就因為主編的裁決, 業務的主導, 總經理的政治考量以及董事的賺錢優先想法下, 還剩下多少 "良知" 是任何人都可以看得出來的.

但就觀察是再怎樣糟糕的媒體, 還是比 80% 的部落客個人文章還要好, 只是這樣是可以鬆口氣的事嗎? 事實上就這 20% 說不定是可以上數十萬個, 這樣的排名真的很不好看, ...

一個記者, 一個律師, 往往經過 "訓練" 表現的比一般人來得 "好", 但往往經過許多事情的經驗與 "成長", 還是有一小群人 "升級" 到某種階級, 而這一些人往往是這一群人的主事者, 到最後這一群人在一起, 做出來的決策, 若是在所謂的 "職業道德" 的框框限制就還好, 但事實上在一群人是笨蛋的定律下, 早就拋棄這職業道德做出讓外人懷疑他們是笨蛋的決策, 即使是我們仔細看這一群人的大部份的個人, 都是比一般人聰明的, 但這無法保證任何事...

當然用這個說法來證明部落客(大部份都是一個人) vs 記者(大部份是一群人) 誰比較聰明誰比較白痴是太過於 "以偏蓋全", 且事實上我想要說的不是部落客與記者, 而是 "個人" 與 "團體", 所謂的 "個人優先" 並不是極端的個人主義, 而是團體的決策與價值觀, 本來就不應該凌越任何 "個人", ...

若是這篇文章是政治文的話: 至少我們該往至少帶頭的那個人的標準不要因為能力, 事故, 經驗而有太低的標準, 品味, ...... 只是現在很多政治的結果往往是在比資源, 比誰的老爸比較好, 真令人搖頭...

熱門文章