2013年6月10日 星期一

小工具: 臉書 QR Code 名片

會寫這個小工具是有一次我介紹 "紅色死神" 給 "EZprice" 同仁時, 死神說了一句話: "就直接給臉書帳號吧, 加了臉書就可以聯絡, 拿了名片還是不會用", 此時就讓我想起一個讓我困擾許久的問題:

在很久以前, Palm 還流行的時候, PDA (Personal Digital Assistance) 最主要的功能之一就是 "名片交換", 而現在手機已經在大眾市場完全取代 PDA 的情型下, 交換名片反而是個很困難的事, 當時 PDA 透過紅外線或其他方式, 是很輕易的交換名片, 而現在大概只有 Line 的搖一搖有如此方便的架構 (UI 流程) 才勉強比擬.

反倒是現在, iOS 與 Android 變成兩大家 Smart Phone 作業平台, 但通訊錄交換這部份還是拙的事, 尤其是 vcf(vCard) 已經沒有多少人在用的情型下, hCard 也沒能展露頭角, 每一個 SNS 都自認為自己是 Social Network 的唯一平台, 但說要交換聯絡方式的方法到現在還是沒進步多少.

當時我就在想, 好吧, 雖然電子名片已經是個做爛的題目, 但現在的實用的確是我最近才開始用的 "臉書", 至少先用臉書當作名片交換也是件不錯的事..

所以就想說, 如何用手機很輕易的加入臉書呢? 而第一個想到的就是 QR-Code, 把網址變成 QR-Code 不是件難事, 但有兩件事要克服:

1. 如何輕易叫出 QR-Code 的圖讓對方掃描呢?
2. 若是用網址的方式叫出瀏灠器也不是對的方式.

因為若是把這張圖放進圖庫, 要從圖庫找出來讓對方來掃, 可能還不如直接輸入較快, 因此一定要把這張圖可以輕易的叫出來, 例如放在桌面是件很重要的事, 而這個的確是原生的 iOS/Android 無法做到的, 一定要有 App 等小工具來完成, 當然若是把這張圖當成網頁, 把這 Bookmark 書籤放在桌面上也是個最好但也最直接的方式, 雖然說這樣是一定要上網, 但沒上網如何加臉書好友呢?

而在第二天我去一家公司聊天, 一開始交換名片時我想到這張圖還在桌面上, 我就輕易的叫出讓大家掃, 只是接下來的第二個問題是: 這樣是叫出網頁, 但大部份的人都是用 Facebook App 來操作, 網頁不只是不習慣, 事實上大部份都不會登入, 因此這方式也不見得是好的操作流程, 最好是直接呼叫臉書應用程式到個人的名片頁才對.

而在第三天在參加 g0v.tw 的 hackth3n 的閒暇之餘, 我找到了一個叫 Shortcut Image 由日本人寫的小工具, 發現這是很好的開始, 所以接下來的問題就是用甚麼簡單的方式呼叫 Facebook App.

因此今天找了一些資料, 在嘗試過幾次之後, 發現不透過 Web 還真的無法將這流程做很好的介接, 所以就先透過訪來客做簡單的轉接, 而此時這樣的臉書 QR Code 名片就已經有雛型, 最後也順便把 QR Code 也自動化的產生出來了.

目前這小工具是放在訪來客裏面, 大家進去看就有看到了, 若大家真的有興趣使用, 我就花個 10 美金買個 SSL 獨立出來好了, 有誰想 Donate 的呢?

2013年6月7日 星期五

比算命還準的資料探勘: 從次級資料(Secondary Data)來看 Big Data

訪來客計劃是有一段很長很長的故事, 甚至這故事可以回溯到四年前之前的 "樂生療養院" 事件, 但這個以後再說, 若說是有近因是我要做 "Weblog.tw" 的臉書版之前的練習是真的, 但與其說是透過 Home Brew 來做學習, 應該說這是一個臉書上的 Data Mining 的實作, 尤其是在看到 2007~2008 年流行的 "Friend Wheel" 時, 我來想說這種計算朋友之間的 "分群" 與 "距離" 可以說是資料探勘最好的範例.

像 Friend Wheel 要畫出來不是難事, 但真的要去分析與判斷就不是件簡單的事, 這也是資料探勘中, 資料呈現 (Data Presentation) 最有趣的事, 因為有時要從 Big Data 去 Mining 出甚麼未知的可能性是相當困難的, 有時若是我們把資料視覺化 (Visualization) 有時確是 "一見即知", 而要去真的計算有時是不太可能的.

這計劃一開始時構想的很好, 若是我們能夠抓到我們朋友的好友數, 有時就可以從相同好友數來去做第一次整理, 但一開始實作時卻又不是那麼一回事, 因為朋友數本來就是可以選擇性隱藏, 因此原本規劃好的演算法就只好拋棄了, 而只好從可以抓的資料來計算, 這也是資料探勘中最常遇到的問題, 並沒有甚麼好意外的了.

畢竟資料收集 (Data Collecting) 一直是比 Data Mining 演算法還更麻煩的一件事, 所以若因此而讓我們放棄從資料來找到答案的話就太可惜了, 因此最後我們採取了另一個演算法來計算, 雖然這方法有時不見得切實際, 但也不失一種方法, 也因此從這個不得已的演算法中找到另一件有趣的事, 而這個又只能留待以後再說.

所以在當時的計劃雖然遇到措折, 但也不是不能解的時候, 勢必又必須換一條新的路, 也就是說, 當發現原本的計劃是想從朋友的分群來做 "資訊導覽" 的時間成本太高 (計算一個人的朋友族群須要好幾小時到好幾天的計算), 因此就打算分階段來進行, 這也就是 "訪來客" 的開始, 也就是 "你臉書生活的精彩度" 這件事.

因為這個計劃最原始只是想透過 "朋友關係" 來去做 "資訊分類", 因此一開始就打算 "只抓交友資料", 而其他的授權就都不去要求, 想以 "最低的必要授權" 來去完成這計劃, 所以這個 "臉書生活精彩度" 雖然不是簡單的只是計算 "好友數", 但也因為沒有透過其他的臉書活動 (Activity) 去做搜集與計算, 而是純以交友的 "模式" (Pattern) 去推估.

畢竟若我們一開始是規劃出 "透過你在臉書的活動" 來去計算 "臉書生活精彩度", 聽起來是最合理的方式, 雖然這樣也是再單純不過的事, 但事實上所須要的成本與阻力也更大, 畢竟這樣須要的授權更多, 要抓的資料也更多, 就如同前面所說的, 困難點有時不是計算資料, 而是如何去獲得資料.

這也是 "次級資料" 有趣的地方, 所謂的次級資料 (Secondary Data) 就是我們計算的結果, 並不是最原始的資料應用的目的, 但因為事出必有因, 這原始資料若是種結果的呈現, 我們可以用某種計算邏輯與方法, 分析出因子去推論出不同的結果.

(想要真的更進一步了解次級資料的, 可以到 MBA 智庫來看)

但任何計算都應該有其假設與邏輯性, 例如在這個臉書生活精彩度的定義不是在於你的好友數, 而是在於你這好友之間是否有互動 (互為好友), 也就是說若好友能夠成群的話, 代表你在臉書的交友是有其完整性的, 因此可以證明你不是到處亂加好友.

而接下來應該已經有不少人去計算你的 "臉書生活精彩度" 了吧, 若你還沒去計算, 就去試試看, 而每一個人只能看到朋友的資料, 不是所有人的資料, 事實上我甚至也沒寫程式自己去看全部的資料, 畢竟我也是想讓大家選擇這樣的授權與否.

在同時, 我也放了一個彩蛋, 當時的連結叫 "很可怕不要問", 這是一個怎樣的數字呢?

既然我們可以從這些數字來知道那些好友是有意義的 (成群的), 那代表可以從其推論那些好友關係並沒有如此密切, 也就是 "你有那些好友是較為不熟識的", 也就是我當時說的:

"這個人若被不熟的朋友或是陌生人加好友, 他接受的比例, 換言之也包含他去加不熟的朋友或陌生人的機率."

所以後來稱為 "開放關係", 我想應該有人猜得出來這個是採用 "Open Relationship" 的雙關吧, 但跟真的定義中的開放關係是有其相關但不是定義.

當然這樣的計算的確是有意義性, 但也不絕對, 因為每一個人的生活模式都不太一樣, 想套用一個算式與邏輯在任何人是有其局限性與適用性, 頂多只能說這也是種 "觀點", 而不是全面性的, 換句話說, 也是種 "客觀的主觀", 畢竟這種 "指數性" (Index) 在某種觀點只是種 "Eigenvalue", 是種 "簡化" 某種 "複雜度", 當經過 "簡化" 必然會失去一些意義, 而我們在使用這種數字一定要有這種體認.

但也是因為人如此的複雜, 說要很輕易的去了解自己的生活與定位也不是那麼簡單, 所以透過這樣的 "診斷", 在某種觀點還真的是種 "算命", 因為這樣的計算有時還真的看得到原本自己看不到的東西, 但也因為這是真實的數字, 所以絕對是 "準確" 的, 所以說是 "比算命還準" 一點也不為過, 因為這是呈現你的行為, 並沒有去做任何的 "猜測", 說起來只是 "換個角度來看", 所以若是認同可以用這角度來看, 沒有不準的可能性, 真正的問題是: "這角度有意義嗎?"

換句話說, 只要能夠找得到一個合理的邏輯依據, 要從人的行為找到其模型與指數來做判斷不是不可能, 就像是我們不可能輕易知道 "你是否跟那些朋友熟不熟", 但我們就可以從模式套用來計算出一個 "很可怕不要問" 的 "開放關係指數" 結果, 只是有時也不見得有用, 尤其是找不到其關聯性的, 最後還是要從更合理的資料搜集下手.

只是若你看到這邊, 可以感受得到 Data Mining/Big Data 的可怕與局限性, 因為若是有足夠的資料, 要算出下面那些東西不是不可能的:

1. 一個人會自殺的傾向
2. 一個人會買某商品的喜好度
3. 這個價格要多少能夠越多人買或賺越多
4. 明天會去逛某商圈的人數
5. 從臉書可以算出你最合適的工作以及未來路徑
6. 再過幾分鐘你那邊就會下雨

而任何資料都是有跡可循, 可以被推算或推算出甚麼東西, 也就是說, 這種事情可以很有幫助, 但也能會很可怕, 有時在於我們怎麼用, 以及用甚麼心態去用以及被誰所用, 甚至用在警察國家或極權國家, 要算出一個人的忠誠度, 以現在技術比以前更輕而易舉, 就像是水能載舟亦能覆舟, 科技有時會讓我們生活變得更好, 也可能會害了人類, 這是我們大家都已經知道不用懷疑的.

我也只能期待未來人類能夠善用這些資料....

若上面文章真的太長了, 你看下面四句話就可了:

1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習

2013年6月6日 星期四

不是 SEOer 的 SEOer 告白: Nofollow Link, Please?

在 SEO 圈的人, 看到我前一篇 "從連結的生與死來談網站連結準則" 知道是為了要回應嚴先生對於之前的連結做探討, 而前幾天有人說他也寫了 "從 Nofollow 看 SEO 的未來" 這篇來做回應, 我當下跟朋友說: "他寫的很好阿", 等等的話, 覺得這篇文章有其論點與方向, 甚至我回頭想一下我寫的那一篇的標題, 還有不少地方沒寫到.

的確, 我會把 "黑帽 SEO" 定義為:

1. 創作沒有人會去看的內容, 沒有意義的內容
2. 建立不受歡迎的連結, 建立不會有人點的連結

這些歸納起來, 就是 Spammer 的問題, 記得我在 "如何用網頁到網頁的延伸閱讀, 取代網站的交互連結" 提到這些 Spammers 讓 Blog 部落格的 "Ping" 從立意良善到沒有人在用了, 也就是說 Jesse 在那篇文章所寫的兩大重點之一:

1. Anti-Spam
2. 自清

Anti-Spam 這件事我已經不太想說了, 因為我早就在那些人眼中是大壞人了, 也因此我也從來不做 SEO 的任何專案, 只有在幫做顧問的公司協助 SEO 以及在 SEO 公司當顧問的主要原因, 因為去跟一般沒概念的公司爭辨甚麼是白帽與黑帽, 不是我能力所及的.

但其中最有趣的 "自清" 這一點, 我看了之後真的讓我覺得自形慚愧阿, 相較作者而言, 我只是一個喜歡從資訊理論與圖書館學去看 SEO 的人, 雖然唸過幾十本 SEO 的書, 也做過十幾個 SEO 系統, 但說實在的, 我自己卻完全不去做 SEO.

當有人問我甚麼是 SEO, 我都會說, "不好意思, 我不是能夠深入淺出的人", 所以都會叫他去唸個至少一兩本有關 SEO 的書, 但我都會說: "書上面所說的方法, 無論是黑的或是白的, 我都不會去做", 也就是說, 我從來不會在我製作的網站去加甚麼 meta-data, 也不會去加 description, 所以, 我真的不是好的 SEOer 阿.

因為我一直相信, "只要做出好的內容對大家有幫助, 且做出好的系統更好去便利使用", 以這樣的觀點去開發, 這是比任何 SEO tricks 更好的 trick, 而這也是我個人最大的實作方式, 這也是我唯一個人在使用的 SEO 技巧, 利用 "Semantic Web/語意網路", 透過 "UX/UI 的改善", 建立 "不同觀點的 View", 實作好的 "技術行銷", 因此大部份 SEO 書上面所說的東西, 我都不會去使用.

因此當 Google 在說 "No-Follow" 的這件事, 我在想說, 我做的系統中, 有那些連結是 "只提及而不背書", 我還在想這到底是在對使用者 "宣示" 還是對 Google "效忠"? 而事實上使用者在看這些文章與內容, 在應用這系統, 早就知道這連結的意義與價值, 何來的 "自清" 阿?

但我也知道不可能要求大家去唸所謂 "幾本 SEO" 的書, 然後消化與實作, 我會花時間在上面, 純脆是我對搜尋引擎的興趣以及對使用者資訊行為有興趣, 而想要透過這種系統實作出對大家有幫助的使用者行為決策資源系統, 跟本跟做 SEO 沒甚麼關係, 我會覺得 SEO 有趣, 是因為 SEO 是種 "內容" 與 "行為" 的一種中介, 這也是我想研究與實作, 因此才會有 "網點", "網智", 等等的系統阿.

也就是說, 我更希望大家在做 SEO 時, 一定要從 "讀者/使用者" 角度出發, 而不是以 "搜尋引擎" 的觀點來切入, 但這個若是做得到, 比任何 SEO 還要困難, 因此就像是在 "台灣搜尋引擎優化與行銷研究院" 所說的, 透過 Nofollow 要來做自清, 尤其是你目前還是照著 SEO 的書來實作, 或者是聽從 SEO 公司的意見, 原作者的文章還是很有價值的.

所以, 說起來, 我的確不是 SEOer 阿....

2013年6月3日 星期一

從連結的生與死來談網站連結準則

曾幾何時, 連結是種尊重與尊敬, 甚至是種榮耀, 但現在, 連結已經在買與賣失去意義了嗎?

基本上在論文的寫作中, 很多人知道教授最喜歡去挑 "參考文獻 (Reference)" 的問題, 因為這樣的宣示往往代表那些是你論文的原創, 那些不是, 但我們也都知道, 絕大部份的碩士論文, 那有甚麼 "原創" 的可能, 而標註參考文獻最大的價值, 是因為你曾做過這樣的努力, 透過這樣的 "連結" 來幫助你看這篇的人, 找到更多的資訊.

因為資訊要成為智慧, 是須要一些過程的, 甚至單一的資訊不太能夠創造智慧, 而是要很多很多的資訊才有智慧的可能, 就像是 "維基", 就像是 "懶人包", 都是種資訊的匯集與發散, 讓資訊成為了解事實的方法, 當了解事實之後, 才能夠進一步的產生價值判斷與行為.

也就是說, 連結代表的是種資訊的傳承與傳遞, 甚至有人說, 文明不是在於人類所產生的智慧, 而是在於傳承, 沒有傳承的知識會隨風飄逝, 即使再偉大也不會被人提及, ....

但把連結說成這麼偉大, 又過於誇張了, 但也曾經有一家公司, 去發現與強調連結的價值, 將之實證與實作, 成為現在大家耳熟能詳的 G 社, 而現在這家公司, 提出 "有人操弄連結的價值", 而去叫大家在使用連結時, 加註 "這不是連結", 來去區分廣告與連結, 我一直在思索這樣是對的方式嗎?

只是與其說這家目前的確是很偉大的公司, 會不會因為做了這樣的事讓原本質疑過他的人更認定 "Do No Evil" 只是個晃子, 但我更相信的有太多人是在做事時, 心中是不存在 "Do No Evil" 的思考, 而以更大的 "正義", "利益" 的招牌做他自己認為可以做的事, 尤其是那些真的讓 "連結" 失去意義的人.

但這意義說起來也沒那麼偉大, 就是這樣的連結與其內容會有沒有人去看, 去使用, 這價值不在於你是不是在連結中註記 "不要連(追蹤)", 而是在於是否以讀者的心態與使用方式去創造與使用連結與產生內容, 也就是在建立這連結時, 你的用心與心態為何?

可是 "心態" 與 "用心" 是最不能衡量的, 就像是想要輕易證明靈魂一樣, 畢竟很多事情雖然本質是最重要的, 但當論及方法論時就不見得實用了, 必須要轉化成準則來實作才是最好的方法, 只是我們必須知道, 任何行為有時看起來一樣, 有時看起來是完全相反, 但其隱藏的心是不能絕對類比的.

我們在做網站連結時那些是對的呢?

1. 連結是內容相關的: 連結在於種將兩件事物做聯繫, 這聯繫的價值在於 "距離", 也就是相關性, 大多是透過關鍵字與語意網路將之串連, 讓原本不在相同空間的資訊透過這樣的連結做延伸, 讓我們可以有更廣的視野.

 

2. 連結是種宣告: 連結在於種所有權的宣告, 包含在製作的目的與精神, 所從屬的組織, 製作的方法與架構等等, 透過這樣的宣告連結, 讓讀者更了解這內容所在的價值與空間角色, 雖然這種連結有時是使用者最少點的, 但也是不可或缺的.

 

3. 連結是針對性的導引: 連結有時候只是種純導引, 可能是購物網站的運費計算方式, 也有可能是種延伸消費與討論, 若能產生意義而導引使用者去看不同的資訊, 這連結就是有價值的.

 

0. 連結是使用者會點的: 無論是前三點說得再冠冕堂皇, 最重要的一個判斷是這個連結是否使用者會去點擊, 若是使用者會點擊, 這連結就有價值, 若是沒有人會去點擊, 則是代表這資訊是沒有連結的價值, 反之一個網站一直有一堆這樣的連結, 就代表不是製作者不用心, 不然就是別有用心.


當然大家會問一個最大的問題, 連結最常會是種有金錢交易的不是 SEO 的連結, 而是 "廣告" 等軟連結 (Soft Link), 這是相當有趣的問題, 但我們知道, 廣告的連結是種具有導引性且使用者會點的連結, 本身並不會有太多的抵觸.

基本上 Google 原本是宣示 "想企圖去操弄連結" 的事, 但最近產生對 SEO 界很大的風暴, 其中甚至延伸成 "廣告是不對的", "付費連結都是黑的", 等等的討論, 而許多人在製作 SEO "一眛" 的去 "假借" G 設的 SEO Guideline, 雖然這指導手冊在我眼中是有問題的, 但理論上已經是可以打擊 80% 以上做黑的人.

但不代表做白的是沒有問題, 畢竟這世界沒有 "非黑即白", 很多事情若是有絕對的 "正義" 那就失去我們生為人的價值, 尤其以前被稱為黑帽 SEO 的是指 Spammer, 也就是用不被歡迎的連結去盜用別人網站的價值, 產生許多沒有意義的內容, 複製重覆的資訊等等的事是被稱為黑帽, 而現在 Google 更直接稱 "買賣連結" 的為 "企圖影響計算" 的黑帽, 甚至是 "交換連結" 的人也算是.

這樣說起來, 可能全世界有 99.99% 的網站都是黑帽了, 尤其是像教育部, 國家機構等最會以 "資訊串連" 去交換連結, 而非 "連結買賣", 而現在透過 G 社的 Guide Line 要他們加上 "nofollow", 在我眼中是本末倒置, 更讓連結的價值加速死亡.

會寫這篇並不是要去對 G 社抗議, 因為他已經大到很難抗衡了, 這篇文章對他們而言只是種 "呢喃", 而是希望透過這篇文章讓大家更正視連結的價值, 包含 "連結買賣", 就像是有人已經說, 不再做連結買賣, 而是把有用的資訊去串連的 "媒合", 而這件事若能做好, 對讀者才最好的.

而我們是否也能夠過這樣的反省, 讓網站製作除了內容外, 透過連結與 UI 來去創作對讀者有更好的閱讀空間?

熱門文章