2013年6月10日 星期一

小工具: 臉書 QR Code 名片

會寫這個小工具是有一次我介紹 "紅色死神" 給 "EZprice" 同仁時, 死神說了一句話: "就直接給臉書帳號吧, 加了臉書就可以聯絡, 拿了名片還是不會用", 此時就讓我想起一個讓我困擾許久的問題:

在很久以前, Palm 還流行的時候, PDA (Personal Digital Assistance) 最主要的功能之一就是 "名片交換", 而現在手機已經在大眾市場完全取代 PDA 的情型下, 交換名片反而是個很困難的事, 當時 PDA 透過紅外線或其他方式, 是很輕易的交換名片, 而現在大概只有 Line 的搖一搖有如此方便的架構 (UI 流程) 才勉強比擬.

反倒是現在, iOS 與 Android 變成兩大家 Smart Phone 作業平台, 但通訊錄交換這部份還是拙的事, 尤其是 vcf(vCard) 已經沒有多少人在用的情型下, hCard 也沒能展露頭角, 每一個 SNS 都自認為自己是 Social Network 的唯一平台, 但說要交換聯絡方式的方法到現在還是沒進步多少.

當時我就在想, 好吧, 雖然電子名片已經是個做爛的題目, 但現在的實用的確是我最近才開始用的 "臉書", 至少先用臉書當作名片交換也是件不錯的事..

所以就想說, 如何用手機很輕易的加入臉書呢? 而第一個想到的就是 QR-Code, 把網址變成 QR-Code 不是件難事, 但有兩件事要克服:

1. 如何輕易叫出 QR-Code 的圖讓對方掃描呢?
2. 若是用網址的方式叫出瀏灠器也不是對的方式.

因為若是把這張圖放進圖庫, 要從圖庫找出來讓對方來掃, 可能還不如直接輸入較快, 因此一定要把這張圖可以輕易的叫出來, 例如放在桌面是件很重要的事, 而這個的確是原生的 iOS/Android 無法做到的, 一定要有 App 等小工具來完成, 當然若是把這張圖當成網頁, 把這 Bookmark 書籤放在桌面上也是個最好但也最直接的方式, 雖然說這樣是一定要上網, 但沒上網如何加臉書好友呢?

而在第二天我去一家公司聊天, 一開始交換名片時我想到這張圖還在桌面上, 我就輕易的叫出讓大家掃, 只是接下來的第二個問題是: 這樣是叫出網頁, 但大部份的人都是用 Facebook App 來操作, 網頁不只是不習慣, 事實上大部份都不會登入, 因此這方式也不見得是好的操作流程, 最好是直接呼叫臉書應用程式到個人的名片頁才對.

而在第三天在參加 g0v.tw 的 hackth3n 的閒暇之餘, 我找到了一個叫 Shortcut Image 由日本人寫的小工具, 發現這是很好的開始, 所以接下來的問題就是用甚麼簡單的方式呼叫 Facebook App.

因此今天找了一些資料, 在嘗試過幾次之後, 發現不透過 Web 還真的無法將這流程做很好的介接, 所以就先透過訪來客做簡單的轉接, 而此時這樣的臉書 QR Code 名片就已經有雛型, 最後也順便把 QR Code 也自動化的產生出來了.

目前這小工具是放在訪來客裏面, 大家進去看就有看到了, 若大家真的有興趣使用, 我就花個 10 美金買個 SSL 獨立出來好了, 有誰想 Donate 的呢?

2013年6月7日 星期五

比算命還準的資料探勘: 從次級資料(Secondary Data)來看 Big Data

訪來客計劃是有一段很長很長的故事, 甚至這故事可以回溯到四年前之前的 "樂生療養院" 事件, 但這個以後再說, 若說是有近因是我要做 "Weblog.tw" 的臉書版之前的練習是真的, 但與其說是透過 Home Brew 來做學習, 應該說這是一個臉書上的 Data Mining 的實作, 尤其是在看到 2007~2008 年流行的 "Friend Wheel" 時, 我來想說這種計算朋友之間的 "分群" 與 "距離" 可以說是資料探勘最好的範例.

像 Friend Wheel 要畫出來不是難事, 但真的要去分析與判斷就不是件簡單的事, 這也是資料探勘中, 資料呈現 (Data Presentation) 最有趣的事, 因為有時要從 Big Data 去 Mining 出甚麼未知的可能性是相當困難的, 有時若是我們把資料視覺化 (Visualization) 有時確是 "一見即知", 而要去真的計算有時是不太可能的.

這計劃一開始時構想的很好, 若是我們能夠抓到我們朋友的好友數, 有時就可以從相同好友數來去做第一次整理, 但一開始實作時卻又不是那麼一回事, 因為朋友數本來就是可以選擇性隱藏, 因此原本規劃好的演算法就只好拋棄了, 而只好從可以抓的資料來計算, 這也是資料探勘中最常遇到的問題, 並沒有甚麼好意外的了.

畢竟資料收集 (Data Collecting) 一直是比 Data Mining 演算法還更麻煩的一件事, 所以若因此而讓我們放棄從資料來找到答案的話就太可惜了, 因此最後我們採取了另一個演算法來計算, 雖然這方法有時不見得切實際, 但也不失一種方法, 也因此從這個不得已的演算法中找到另一件有趣的事, 而這個又只能留待以後再說.

所以在當時的計劃雖然遇到措折, 但也不是不能解的時候, 勢必又必須換一條新的路, 也就是說, 當發現原本的計劃是想從朋友的分群來做 "資訊導覽" 的時間成本太高 (計算一個人的朋友族群須要好幾小時到好幾天的計算), 因此就打算分階段來進行, 這也就是 "訪來客" 的開始, 也就是 "你臉書生活的精彩度" 這件事.

因為這個計劃最原始只是想透過 "朋友關係" 來去做 "資訊分類", 因此一開始就打算 "只抓交友資料", 而其他的授權就都不去要求, 想以 "最低的必要授權" 來去完成這計劃, 所以這個 "臉書生活精彩度" 雖然不是簡單的只是計算 "好友數", 但也因為沒有透過其他的臉書活動 (Activity) 去做搜集與計算, 而是純以交友的 "模式" (Pattern) 去推估.

畢竟若我們一開始是規劃出 "透過你在臉書的活動" 來去計算 "臉書生活精彩度", 聽起來是最合理的方式, 雖然這樣也是再單純不過的事, 但事實上所須要的成本與阻力也更大, 畢竟這樣須要的授權更多, 要抓的資料也更多, 就如同前面所說的, 困難點有時不是計算資料, 而是如何去獲得資料.

這也是 "次級資料" 有趣的地方, 所謂的次級資料 (Secondary Data) 就是我們計算的結果, 並不是最原始的資料應用的目的, 但因為事出必有因, 這原始資料若是種結果的呈現, 我們可以用某種計算邏輯與方法, 分析出因子去推論出不同的結果.

(想要真的更進一步了解次級資料的, 可以到 MBA 智庫來看)

但任何計算都應該有其假設與邏輯性, 例如在這個臉書生活精彩度的定義不是在於你的好友數, 而是在於你這好友之間是否有互動 (互為好友), 也就是說若好友能夠成群的話, 代表你在臉書的交友是有其完整性的, 因此可以證明你不是到處亂加好友.

而接下來應該已經有不少人去計算你的 "臉書生活精彩度" 了吧, 若你還沒去計算, 就去試試看, 而每一個人只能看到朋友的資料, 不是所有人的資料, 事實上我甚至也沒寫程式自己去看全部的資料, 畢竟我也是想讓大家選擇這樣的授權與否.

在同時, 我也放了一個彩蛋, 當時的連結叫 "很可怕不要問", 這是一個怎樣的數字呢?

既然我們可以從這些數字來知道那些好友是有意義的 (成群的), 那代表可以從其推論那些好友關係並沒有如此密切, 也就是 "你有那些好友是較為不熟識的", 也就是我當時說的:

"這個人若被不熟的朋友或是陌生人加好友, 他接受的比例, 換言之也包含他去加不熟的朋友或陌生人的機率."

所以後來稱為 "開放關係", 我想應該有人猜得出來這個是採用 "Open Relationship" 的雙關吧, 但跟真的定義中的開放關係是有其相關但不是定義.

當然這樣的計算的確是有意義性, 但也不絕對, 因為每一個人的生活模式都不太一樣, 想套用一個算式與邏輯在任何人是有其局限性與適用性, 頂多只能說這也是種 "觀點", 而不是全面性的, 換句話說, 也是種 "客觀的主觀", 畢竟這種 "指數性" (Index) 在某種觀點只是種 "Eigenvalue", 是種 "簡化" 某種 "複雜度", 當經過 "簡化" 必然會失去一些意義, 而我們在使用這種數字一定要有這種體認.

但也是因為人如此的複雜, 說要很輕易的去了解自己的生活與定位也不是那麼簡單, 所以透過這樣的 "診斷", 在某種觀點還真的是種 "算命", 因為這樣的計算有時還真的看得到原本自己看不到的東西, 但也因為這是真實的數字, 所以絕對是 "準確" 的, 所以說是 "比算命還準" 一點也不為過, 因為這是呈現你的行為, 並沒有去做任何的 "猜測", 說起來只是 "換個角度來看", 所以若是認同可以用這角度來看, 沒有不準的可能性, 真正的問題是: "這角度有意義嗎?"

換句話說, 只要能夠找得到一個合理的邏輯依據, 要從人的行為找到其模型與指數來做判斷不是不可能, 就像是我們不可能輕易知道 "你是否跟那些朋友熟不熟", 但我們就可以從模式套用來計算出一個 "很可怕不要問" 的 "開放關係指數" 結果, 只是有時也不見得有用, 尤其是找不到其關聯性的, 最後還是要從更合理的資料搜集下手.

只是若你看到這邊, 可以感受得到 Data Mining/Big Data 的可怕與局限性, 因為若是有足夠的資料, 要算出下面那些東西不是不可能的:

1. 一個人會自殺的傾向
2. 一個人會買某商品的喜好度
3. 這個價格要多少能夠越多人買或賺越多
4. 明天會去逛某商圈的人數
5. 從臉書可以算出你最合適的工作以及未來路徑
6. 再過幾分鐘你那邊就會下雨

而任何資料都是有跡可循, 可以被推算或推算出甚麼東西, 也就是說, 這種事情可以很有幫助, 但也能會很可怕, 有時在於我們怎麼用, 以及用甚麼心態去用以及被誰所用, 甚至用在警察國家或極權國家, 要算出一個人的忠誠度, 以現在技術比以前更輕而易舉, 就像是水能載舟亦能覆舟, 科技有時會讓我們生活變得更好, 也可能會害了人類, 這是我們大家都已經知道不用懷疑的.

我也只能期待未來人類能夠善用這些資料....

若上面文章真的太長了, 你看下面四句話就可了:

1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習

2013年6月6日 星期四

不是 SEOer 的 SEOer 告白: Nofollow Link, Please?

在 SEO 圈的人, 看到我前一篇 "從連結的生與死來談網站連結準則" 知道是為了要回應嚴先生對於之前的連結做探討, 而前幾天有人說他也寫了 "從 Nofollow 看 SEO 的未來" 這篇來做回應, 我當下跟朋友說: "他寫的很好阿", 等等的話, 覺得這篇文章有其論點與方向, 甚至我回頭想一下我寫的那一篇的標題, 還有不少地方沒寫到.

的確, 我會把 "黑帽 SEO" 定義為:

1. 創作沒有人會去看的內容, 沒有意義的內容
2. 建立不受歡迎的連結, 建立不會有人點的連結

這些歸納起來, 就是 Spammer 的問題, 記得我在 "如何用網頁到網頁的延伸閱讀, 取代網站的交互連結" 提到這些 Spammers 讓 Blog 部落格的 "Ping" 從立意良善到沒有人在用了, 也就是說 Jesse 在那篇文章所寫的兩大重點之一:

1. Anti-Spam
2. 自清

Anti-Spam 這件事我已經不太想說了, 因為我早就在那些人眼中是大壞人了, 也因此我也從來不做 SEO 的任何專案, 只有在幫做顧問的公司協助 SEO 以及在 SEO 公司當顧問的主要原因, 因為去跟一般沒概念的公司爭辨甚麼是白帽與黑帽, 不是我能力所及的.

但其中最有趣的 "自清" 這一點, 我看了之後真的讓我覺得自形慚愧阿, 相較作者而言, 我只是一個喜歡從資訊理論與圖書館學去看 SEO 的人, 雖然唸過幾十本 SEO 的書, 也做過十幾個 SEO 系統, 但說實在的, 我自己卻完全不去做 SEO.

當有人問我甚麼是 SEO, 我都會說, "不好意思, 我不是能夠深入淺出的人", 所以都會叫他去唸個至少一兩本有關 SEO 的書, 但我都會說: "書上面所說的方法, 無論是黑的或是白的, 我都不會去做", 也就是說, 我從來不會在我製作的網站去加甚麼 meta-data, 也不會去加 description, 所以, 我真的不是好的 SEOer 阿.

因為我一直相信, "只要做出好的內容對大家有幫助, 且做出好的系統更好去便利使用", 以這樣的觀點去開發, 這是比任何 SEO tricks 更好的 trick, 而這也是我個人最大的實作方式, 這也是我唯一個人在使用的 SEO 技巧, 利用 "Semantic Web/語意網路", 透過 "UX/UI 的改善", 建立 "不同觀點的 View", 實作好的 "技術行銷", 因此大部份 SEO 書上面所說的東西, 我都不會去使用.

因此當 Google 在說 "No-Follow" 的這件事, 我在想說, 我做的系統中, 有那些連結是 "只提及而不背書", 我還在想這到底是在對使用者 "宣示" 還是對 Google "效忠"? 而事實上使用者在看這些文章與內容, 在應用這系統, 早就知道這連結的意義與價值, 何來的 "自清" 阿?

但我也知道不可能要求大家去唸所謂 "幾本 SEO" 的書, 然後消化與實作, 我會花時間在上面, 純脆是我對搜尋引擎的興趣以及對使用者資訊行為有興趣, 而想要透過這種系統實作出對大家有幫助的使用者行為決策資源系統, 跟本跟做 SEO 沒甚麼關係, 我會覺得 SEO 有趣, 是因為 SEO 是種 "內容" 與 "行為" 的一種中介, 這也是我想研究與實作, 因此才會有 "網點", "網智", 等等的系統阿.

也就是說, 我更希望大家在做 SEO 時, 一定要從 "讀者/使用者" 角度出發, 而不是以 "搜尋引擎" 的觀點來切入, 但這個若是做得到, 比任何 SEO 還要困難, 因此就像是在 "台灣搜尋引擎優化與行銷研究院" 所說的, 透過 Nofollow 要來做自清, 尤其是你目前還是照著 SEO 的書來實作, 或者是聽從 SEO 公司的意見, 原作者的文章還是很有價值的.

所以, 說起來, 我的確不是 SEOer 阿....

2013年6月3日 星期一

從連結的生與死來談網站連結準則

曾幾何時, 連結是種尊重與尊敬, 甚至是種榮耀, 但現在, 連結已經在買與賣失去意義了嗎?

基本上在論文的寫作中, 很多人知道教授最喜歡去挑 "參考文獻 (Reference)" 的問題, 因為這樣的宣示往往代表那些是你論文的原創, 那些不是, 但我們也都知道, 絕大部份的碩士論文, 那有甚麼 "原創" 的可能, 而標註參考文獻最大的價值, 是因為你曾做過這樣的努力, 透過這樣的 "連結" 來幫助你看這篇的人, 找到更多的資訊.

因為資訊要成為智慧, 是須要一些過程的, 甚至單一的資訊不太能夠創造智慧, 而是要很多很多的資訊才有智慧的可能, 就像是 "維基", 就像是 "懶人包", 都是種資訊的匯集與發散, 讓資訊成為了解事實的方法, 當了解事實之後, 才能夠進一步的產生價值判斷與行為.

也就是說, 連結代表的是種資訊的傳承與傳遞, 甚至有人說, 文明不是在於人類所產生的智慧, 而是在於傳承, 沒有傳承的知識會隨風飄逝, 即使再偉大也不會被人提及, ....

但把連結說成這麼偉大, 又過於誇張了, 但也曾經有一家公司, 去發現與強調連結的價值, 將之實證與實作, 成為現在大家耳熟能詳的 G 社, 而現在這家公司, 提出 "有人操弄連結的價值", 而去叫大家在使用連結時, 加註 "這不是連結", 來去區分廣告與連結, 我一直在思索這樣是對的方式嗎?

只是與其說這家目前的確是很偉大的公司, 會不會因為做了這樣的事讓原本質疑過他的人更認定 "Do No Evil" 只是個晃子, 但我更相信的有太多人是在做事時, 心中是不存在 "Do No Evil" 的思考, 而以更大的 "正義", "利益" 的招牌做他自己認為可以做的事, 尤其是那些真的讓 "連結" 失去意義的人.

但這意義說起來也沒那麼偉大, 就是這樣的連結與其內容會有沒有人去看, 去使用, 這價值不在於你是不是在連結中註記 "不要連(追蹤)", 而是在於是否以讀者的心態與使用方式去創造與使用連結與產生內容, 也就是在建立這連結時, 你的用心與心態為何?

可是 "心態" 與 "用心" 是最不能衡量的, 就像是想要輕易證明靈魂一樣, 畢竟很多事情雖然本質是最重要的, 但當論及方法論時就不見得實用了, 必須要轉化成準則來實作才是最好的方法, 只是我們必須知道, 任何行為有時看起來一樣, 有時看起來是完全相反, 但其隱藏的心是不能絕對類比的.

我們在做網站連結時那些是對的呢?

1. 連結是內容相關的: 連結在於種將兩件事物做聯繫, 這聯繫的價值在於 "距離", 也就是相關性, 大多是透過關鍵字與語意網路將之串連, 讓原本不在相同空間的資訊透過這樣的連結做延伸, 讓我們可以有更廣的視野.

 

2. 連結是種宣告: 連結在於種所有權的宣告, 包含在製作的目的與精神, 所從屬的組織, 製作的方法與架構等等, 透過這樣的宣告連結, 讓讀者更了解這內容所在的價值與空間角色, 雖然這種連結有時是使用者最少點的, 但也是不可或缺的.

 

3. 連結是針對性的導引: 連結有時候只是種純導引, 可能是購物網站的運費計算方式, 也有可能是種延伸消費與討論, 若能產生意義而導引使用者去看不同的資訊, 這連結就是有價值的.

 

0. 連結是使用者會點的: 無論是前三點說得再冠冕堂皇, 最重要的一個判斷是這個連結是否使用者會去點擊, 若是使用者會點擊, 這連結就有價值, 若是沒有人會去點擊, 則是代表這資訊是沒有連結的價值, 反之一個網站一直有一堆這樣的連結, 就代表不是製作者不用心, 不然就是別有用心.


當然大家會問一個最大的問題, 連結最常會是種有金錢交易的不是 SEO 的連結, 而是 "廣告" 等軟連結 (Soft Link), 這是相當有趣的問題, 但我們知道, 廣告的連結是種具有導引性且使用者會點的連結, 本身並不會有太多的抵觸.

基本上 Google 原本是宣示 "想企圖去操弄連結" 的事, 但最近產生對 SEO 界很大的風暴, 其中甚至延伸成 "廣告是不對的", "付費連結都是黑的", 等等的討論, 而許多人在製作 SEO "一眛" 的去 "假借" G 設的 SEO Guideline, 雖然這指導手冊在我眼中是有問題的, 但理論上已經是可以打擊 80% 以上做黑的人.

但不代表做白的是沒有問題, 畢竟這世界沒有 "非黑即白", 很多事情若是有絕對的 "正義" 那就失去我們生為人的價值, 尤其以前被稱為黑帽 SEO 的是指 Spammer, 也就是用不被歡迎的連結去盜用別人網站的價值, 產生許多沒有意義的內容, 複製重覆的資訊等等的事是被稱為黑帽, 而現在 Google 更直接稱 "買賣連結" 的為 "企圖影響計算" 的黑帽, 甚至是 "交換連結" 的人也算是.

這樣說起來, 可能全世界有 99.99% 的網站都是黑帽了, 尤其是像教育部, 國家機構等最會以 "資訊串連" 去交換連結, 而非 "連結買賣", 而現在透過 G 社的 Guide Line 要他們加上 "nofollow", 在我眼中是本末倒置, 更讓連結的價值加速死亡.

會寫這篇並不是要去對 G 社抗議, 因為他已經大到很難抗衡了, 這篇文章對他們而言只是種 "呢喃", 而是希望透過這篇文章讓大家更正視連結的價值, 包含 "連結買賣", 就像是有人已經說, 不再做連結買賣, 而是把有用的資訊去串連的 "媒合", 而這件事若能做好, 對讀者才最好的.

而我們是否也能夠過這樣的反省, 讓網站製作除了內容外, 透過連結與 UI 來去創作對讀者有更好的閱讀空間?

2013年5月14日 星期二

你的臉書生活精彩度幾分?

有人應該看到我兩三個星期前寫了一篇 "一個表格", 這是一個很有趣的計算, 因為若是我們能夠對朋友做自動分類, 這代表可以從資訊源的差異來去看資訊分類, 只是這個 "分群 (Clustering)" 一直是最麻煩的事, 因此在確定運作之後, 就放在這邊了.

因為隨便一個人的計算, 就好好幾小時或好幾天, 說要讓使用者等到資料的產出是不太可能的, 因此就有了先做一些好玩小工具, 之後再推出這套系統, 而今天做出來的 "臉書生活精彩度" 就是一連串計劃的子計劃.

這資料是從你的好友與你的共同好友資料去做分析的, 計算的基礎有幾種思索:

1. 網路好友的交集代表你在網路生活的密集度
2. 你有多少個 "有一定數量交集" 的好友是網路生活的基礎
3. 好友數越高自然有一定的加乘
4. 總共同好友數越高也會有加乘

因此, 這個不是算好友數這麼簡單出來的計算, 我也在討論放出目前計算的公式:

Count(MutalFriends>min(Friends/50, 40+Friends/1000))*log(Friends)*log(Sum(MutalFriends))

當然這分數有幾個特色:

1. 算的是臉書網路生活, 不是算你全部的生活
2. 有些人在臉書的交友圈都很獨立, 並沒有甚麼其他朋友交集, 此時分數就較低
3. 有些人會有刪好友的習慣, 在某種情型下分數會變高, 也有時會變低 (這不是廢話, 而是要看你怎刪)

目前我在說明是這樣寫的:

30 分以下 => 你算網路人嗎?
30~60 分 => 算你有在用網路好了
60~100 分 => 你是不折不扣的網路中堅份子
100~300 分 => 你已經算活在網路上了
300 分以上 => 你確定你有離開網路過嗎 


基本上正常人應該都是在 30 分到 60 分之間, 事實上我認為 8 成的人都應該是 60 分以下, 當然是包含偶而上網的人, 而你在今天或一個星期類看到這篇文章跑去做, 很少會低於 30 分的, 而 60 分自然表示是在網路上工作或本身就是在網路媒體業.

而超過 100 分的, 已經代表在網路有一定的名聲 ("生活圈"), 不是泛泛之輩, 就像我就不到 100 分, 落在 60~100 分, 而其中超過 300 分的, 我絕不相信他一天在臉書小於四小時, 基本上就去看醫生了... (阿, 有一個就是精神科醫生)

想要去玩玩看的就進 https://apps.facebook.com/frienque/ 看看吧, 右圖是一個算出來的範例, 我把一些我知道比較少在我牆上發言的給 Blur 掉了, 而剩下的我不相信我貼出來他們敢打我, 哈哈~~~

只是算這個須要一定的時間, 可能要多按幾次 "進行分析" 才能夠把資料抓完, 最後就會有 "分析中" 的提示, 此時你就可以去做其他事, 因為要花一段時間才能算完, 這時間大約是你的好友數乘上 1.5 秒, 也就是說你有 200 個好友, 就代表要等 5 分鐘再進來看結果...

有興趣的人去玩玩看吧.....

2013年5月11日 星期六

台菲網路戰(?) 的災情報導... Taiwan vs Philippine Cyber Wars


雖然這次的事件有很多的觀點, 包含大家慢慢知道這種事件已經不是第一次的偶發事件, 算是種集團性行為, 且行之有年了, 但或許因為網路的關係, 或是馬政府的關係大家慢慢發現屏東漁民的辛苦與悲哀.

當然不就政治討論, 畢竟這個討論不完, 只是我在想這樣的攻擊到底有沒有效, 畢竟這種事有時候是挺麻煩的, 畢竟這是種另類的抗議, 基本上我是認為只要對象是對的, 就沒問題, 因此看到有人說想要攻擊菲律賓的醫療系統以命償命, 我就認為這是相當不好的事.

而若是能夠讓菲律賓政府正視這事情, 而不要傷害到人命, 會不會有其他更好的方法我不知道, 但我是在觀察的是, 菲律賓政府真的發現這事了嗎?


一直到 2~3 個小時前看到菲律賓的新聞報導, 他們選舉委員會(?)在投票前夕, 當掉了兩天, 而也知道這是 DDOS 的攻擊, 也來自台灣, 也知道 "the attacks are a reaction to an incident Thursday morning in the seas between Taiwan and the Philippines in which a Taiwanese fisherman was killed by the Philippine Coast Guard, after his vessel threatened to ram the coast guard ship." 這事, 若這事發展到這邊來看, 不是影響民生而是讓那些權力份子傷腦筋, 這的確是該鼓掌.

甚至也列出在今天早上 11:00 無法連線的網站:


Department of National Defense, www.dnd.gov.ph
Department of Foreign Affairs, www.dfa.gov.ph
Department of Interior and Local Government, www.dilg.gov.ph
Department of Science and Technology, www.dost.gov.ph
Philippine National Police, www.pnp.gov.ph
Philippine Army, www.army.mil.ph
Philippine Navy, www.navy.mil.ph
Philippines News Agency, www.pna.gov.ph
Philippine Information Agency, www.pia.gov.ph

也列出目前被攻擊的網站, 這份資料, 跟 "https://dl.dropboxusercontent.com/u/12618422/philippine.html" 原始是一樣的, 但現在這網站已經把預設網址給拿走了.

而菲律賓的新聞報導也找到 Inside 的文章, 來證明這是台灣所做的, 菲律賓也在研究這攻擊所造成的結果, 但能否因為這樣的事也正視這件漁民受害事件, 也有可能最後是用這事模糊焦點, 這不只要觀察菲律賓政府的反應, 也代表這次這種 DDOS 的台菲網路戰真的發生效果, 而上面的列表或許是他們重視的列表吧....


2013年5月1日 星期三

政府開放平台, 測試成功了嗎?

這幾天大家應該有不少人在鼓掌, 至少我也很想鼓掌, 就是我們的政府終於跨出了第一步, 做了 "政府資料開放平臺", 身為我們人民應該給予支持是真的, 畢竟這不只是政府 "英明" 的決策, 更是許多 "民間友人" 的努力成果, 雖然我們沒必要在這邊討論這是誰的功勞, 因為大家都知道, 這是許多公務人員在爭功諉過之外的成就, 所以身為一個平民, 我的手的確有拍下去了.

雖然就政治學面與社會學面, 這是一個偉大的成就, 但就一個工程師的角度來看, 這次所謂的 "公測", 就系統面與內容面是否有達到其標準, 甚至在實用性會是如何, 會有不同的想法, 而這邊以一個開發者, 或者是以我這類型的 "資訊缺乏症候群患者" 的角度來思考, 這個平台測試的是否有成功?

就公開資料而言, 我會有幾點思索:

1. 機讀性: 是否是機器可以輕易讀取與應用
2. 即時性: 是否有時間資料的價值
3. 應用性: 是否有實用且應用的價值

當然應用性這個問題是最無法量化或操作型定義, 所以若是以工程師的角度來看, 至少可以分析判斷的是機讀性與即時性.

機讀是在圖書館學的名詞, 也就是指用機器是否可以輕易讀到, 這牽涉到格式與讀取方式, 而這邊包含的幾個問題:

1. 是否是公開的格式
2. 是否有欄位的定義
3. 是否可以輕易分析

其中我們知道像 TXT 檔雖然是很容易讀到, 但因為沒有欄位是很難分析, 而 CSV 往往因為沒有欄位描述與定義, 也很難去做再次處理, 而圖檔是更不用說是最麻煩的事, 相對的, XML, JSON 都是對機讀是親和的, 而在全部的 239 筆資料中, 不到一半是用 XML 與 JSON, 反倒是不少地理資訊是用 SHP, KMZ 來包裝, 這是值得讚許的, 但除外我也想不出較好的包裝方式.

在時間即時性方面, 有 15 項是有即時 (每10分鐘或每小時或每六小時) 在更新的,  每日更新的也有 26 個 (有 10 個不具每日性), 除外都是以每月每年為主, 這邊可以參考下表.


在看完這些資料, 有幾個想法:

1. 做得最好的大概是氣象局, 文化部, 水利署這三個單位, 無論就即時性, 應用性與機讀性這三個方面都做得相當好.

2. 蒙藏委員會雖然資料應用性不高, 但看起來相當認真, 相對省議會的資料在這邊是用來濫竽充數用的, 感覺是來亂的.

3. 相對的應該有更多資料的環保署, 交通部與經濟部 (主計處) 是可以做得更多更好才對, 但這次並沒有好的表現, 這是相當可惜或值得期許的.

雖然我是個工程師, 但只是個開發工程師而不是專業的測試工程師, 因此沒有對其穩定度, 效率, 錯誤做進一步的檢討, 而是以一個資料使用者的人民來看, 這個系統是否有價值.

只是若這是一個開放平台, 真正的價值不該只有從政府輸出資料而已, 而是人民該用這些資料如何改善自己的生活, 監督政府, 進一步的討論與改變, 甚至不只是單向的資料開放, 而是該更多向的開放資料, 讓資訊變得有價值, 才是 Open Data 的真義.

下面是原始 Google Docs:

熱門文章