2013年11月27日 星期三

不, 你不可能不歧視同性戀, 但你的下一代可以...

只要是有文化, 只要是有歷史, 只要是有種族, 無論是人類 (或是魚人) 都很難擺脫歧視與被歧視的經驗, 而這經驗, 往往會根深蒂固, 很難改變, 甚至是不可能改變, 畢竟這些岐視的劃分與刻版印像都是從成長經驗所造成的, 因為所學, 所思, 所想, 所行為的都是如此, 要一個人不再岐視別人有時是比登天還難的, 但不代表我們要繼續岐視下去.

因為, 這個 "階級/劃分" 往往原是社會想要維護制序與保護權力所須要的, 當這個須要慢慢鬆動, 或威權體制慢慢鬆動與瓦解, 或者是另一股力量慢慢形成時, 這個矛盾點就會發生, 這個岐視與當時的社會發生許多衝突與扭區, 也會發生很多矛盾現像, 當有些人站出來說, 不對, 這樣的去區分是不對的, 事實上大家都是一樣時, 雖然一開始的確是會很混亂, 畢竟既有的典範會被打破, 只是當原本的保守派不得不接受改變的力量時, 因為這岐視所發生的特權或權利不公平現像才會得已解決...

的確, 要你們去不要岐視同性戀, 不再認為這是罪惡, 這樣的事是不可能的, 記的曾看過一句話: "當這學界真正認同相對論, 而不再依賴以太(Ether)為絕對坐標的重要, 並不是原本主張者改變主張被說服, 而是他們知道他們只能接受, 而一直當這社會的新進越來越多人接受相對論, 而原本的人逝去, 這個社會才會都認同相對論是對的".

此時不禁讓我想到 "費雪泰格 (Fisher Tiger)" 在臨死之前, 也不得不承認這樣的歧視一直存在他的心中, 而他知道自己無法擺脫這樣的枷鎖, 但他更知道我們是要建立一個不再歧視的世界, 是要讓我們的下一代不要再有岐視與被岐視的經驗, 並不是任何一方要去抹殺任何一方的存在, 更不是要讓這種壓抑與憤怒傳給下一代.

的確, 我們這一代還是不少人相信 "建設不能停", 即使會讓一些走上絕路, 更相信一個 "成功" 是架構在社會地位以及資產, 也認為一個 "君君臣臣父父子子" 的社會框架才是對的, 即使在我們好不容易脫離 "膚種", "省級", "男女", 等之間的岐視, 事實上我們的社會還存在很多岐視, 而我們並不認為我們是在岐視, 是因為我們只是認為這是 "優劣" 與 "對錯" 甚至認為這是 "罪惡", 這就是真正的 "岐視" 阿.

是的, 我們的確是可以用理智說服這個時代已經來臨, 但對於多數的人來說, 他們是對這樣的世代有很大的恐懼, 認為這樣的社會只會更亂, 對同性戀還是相當恐懼, 但你的確可以站出來說, 對的, 我是有恐同症, 但這是錯的, 因為, 這個社會更重要的是愛, 而愛是有很多種, 100 種人有超過 10 種對愛情不同的觀點, 而性別與性取向難道會只有 10 種嗎?

但更重要的就是接受與生活在一起, 而我們有些人已經錯過了這樣的光陰, 但不代表我們的下一代還是必須生活在充滿岐視的社會之中, 我們的社會, 存在太多霸凌的事了, 而這些都是源自於不平等, 岐視, 暴力, 而我們應該很清楚的知道, 現在是誰在霸凌誰, 性別與家庭的框架是最常見霸凌的藉口與理由, 學校對於性別認同與性向若跟社會不一樣的小孩, 往往是最先被霸凌的對像, 若這社會能夠真的把愛延伸, 這樣不是更好嗎?

事實上這次多元成家的衝突, 我並不擔心會無法通過, 因為即使現在沒辦法通過, 過了五年, 十年, 二十年我相信人類的自覺一定會通過與接受, 只是難道我們還要讓我們的下一代再痛苦與爭扎個五年, 十年或二十年, 難道我們不能放下自己的岐視去接受自己這一代的包袱嗎? 我最擔心的反而是當這社會慢慢更多元時, 的確我們會更不安, 但我們不應該是去讓這不安延續, 而是讓下一代了解: 是的, 你們是更可以做自己, 不像我們這一代.

雖然你可以不接受同性戀婚姻, 也不須要你接受, 但為了下一代, 不要讓他們繼續岐視與互相憎恨, 才該是我們要做的事.

2013年11月19日 星期二

[林克傳說] 話題發燒度 -- 第一個真正的產品, 不是副產品 (Link Quest)

有在追我臉書的人都知道我最近在做林克傳說, 這是一個用來讓大家知道現在臉書分享連結的分析系統, 其中完成的過程是:

1. 以個人做出發, 那些訊息是我朋友分享最多的, 依一定週期的次數次序來排
2. 目前系統所有人在一定時間內塗鴉牆分享數的排序 (A)
3. 從分享連結的網站, 來看這個人的閱讀息性 => 資訊來源偏離度
4. 我的朋友中, 各個屬性的排行榜 => 想知道誰真正的本質嗎?
5. 計算出真正的熱門話題的擴散性, 而不是只是算分享數的轉換 (B)
6. 我應該找誰討論 => 從閱讀網站的屬性找出跟你最相似的閱讀者
7. 計算出話題與真實臉書的比例轉換公式 (C)

其中有一個相同的 A => B => C 就是從分享數算到熱度算到真實的比例, 這過程看起來簡單, 但也花了快 3 個星期 (從11月1日做到現在), 而我之前說的, 這七個子系統, 都只是 "副產品", 真正的第一個產品應該是:

"系統是否能夠即時的提示我那些資訊變熱門?"

雖然這個在以 "個人" 為出發的前提下, 不是個好系統, 但對於 "資訊匱乏恐慌症候群" 的患者, 是一個很大的福音 (?), 這也是第一個有 Notification 的功能, 更也是最值得做成 App 的資訊.

這系統是讓使用者選擇 10%, 20%, 30%, 50% 之類的比例, 這比例指的是 "這訊息出現在使用者塗鴉牆占所有使用者的比例(台灣)", 當某個分享超過這個比例就會出現在這列表當中, 當然這也可以做成像訊息列那樣, 有已讀與未讀, 所以更可以做個功能: 放大絕 (所有設成已讀), 這樣我相信一定可以讓病情 (資訊焦慮症患者) 降低一些些...

當然就我的個性我不希望讓系統成為 "單向度/同質性" 太高的閱讀行為, 所以一定會以個人做出發, 只是現在是在做觀察, 因為在我認知的訊息密度一定是介於一個可以調整的系統:

1. 一天一則最值得看的訊息
2. 一天十則最值得看的列表
3. 一週10則最值得看的清單
4. 一週只看一則有甚麼最值得看的

除了讓人可以選擇訊息密度外, 且有三個選項:

1. 全部相同的觀點
2. 依你閱讀習慣的觀點
3. 更有價值的觀點

這系統自然是希望完成第三點, 但也是最困難的點, 因為這個 "價值" 有時是很難定義的, 因為這有時會遷涉到價值觀等的主觀判斷, 但也不是說完全做不到, 例如可以用 "你期望的典範 Role Model" 來去趨近 (Approach), 當然現在系統已經一步步完成, 在第二點還在做微調的情型下, 第一點是最簡單可以完成的.

我相信很多人到現在已經看得霧煞煞, 那麼單純的一個 "分享" 數數系統可以變得那麼複雜, 這也是 Data Mining (Big Data?) 困難的地方, 看起來很簡單, 但須要很複雜的流程才能做到, 看起來那麼不可行, 確又可以用 "量" 去產成出有 "質" 的東西.

這也可以證明一個真的可以實用的系統, 在做出之前, 的確可以做出不少有趣的 "副產品", 往往有這副產品的經驗, 才可以讓真正的主產品完善, 尤其是這種大量資料的計算, 就像是我之前有提到, Facelab 的這個 Project, 要做出能夠真的靠臉來判斷人的工具, 真的在實用化之前必然有很多 "副產品", 之中最有名的就是 "Meet the world's Mrs Averages: Scientists blend thousands of faces together to reveal what the typical woman's face looks like in 41 different countries from around the globe" (41 個不同國家女性的典型長相) 這個成果, 所以這篇文章用的圖是這個 Lab 10 個成員的 "Average Face".

當然有 Average, 也要去講 "Unique", 所以原本這網址要改名的, 但最後還是延用 que.tw, 只是取的不是 Unique, 而是 Quest, 因此也真的真除 "林客傳說(探索)" 這計劃名.

寫到這邊, 又忘了給大家網址: http://link.que.tw/new.php, Have Fun!!!

2013年11月13日 星期三

臉書話題榜 -- 林克傳說, 一個 Big Data 的實務經驗

雖然說, Big Data 無所不能, 無所不在, 但前提是要先做出來, 只是在做出來時, 所須要的環節與經驗太多, 而這次我以在做林克傳說, 一個可以算出台灣臉書熱門話題排行榜, 並進一步分析你個人閱讀的偏好, 以及建議的系統實作經驗給大家做分享.

我在臉書上說:
這個系統源自於 2007/2008 年樂生事件給我很大的感觸, 當時透過 Plurk/Facebook 等 SNS 收到資訊, 覺得整個世界被樂生洗版, 但事實上對大部份的民眾是完全不知道這回事, 一直等倒 2008/2009 因為選舉關係主流媒體批露才被大家知道, 此時發現 SNS 會造成資訊獲取很大的謬誤. 
在之間提了很多次, 也規劃很多次計劃, 想要解決這樣的問題, 做出一個媒體觀察與使用者建議的系統, 但最後都不了了之, 因為這邊有幾個困難點:

1. 要搜集各個新聞平台的內容資訊做分析
2. 要能夠計算了解到讀者怎看這新聞
3. 要有以新聞字詞為主的語意網路

單單這三點都不是一個小系統, 甚至又是一個可以獨立為 Big Data 專案的事, 而事實上像這樣的系統, 一開始的系統分析就往往跟你習慣的方式不太一樣.

Big Data 的很多 V 其中有兩個是 Variety (多樣性) 與 Veracity (真實性), 通常在系統規劃中, 最常遇到的就是開 Spec (規格), 但由於 Big Data 的資料源本來就是來自於各個地方, 與其說有 Spec 還不如在面臨成千上萬個 Spec 中, 你不可能定義出一個準確的規格書? 不要說拿不到, 事實上也不存在 (每天都有人在變動), 即使你以為很單純的東西, 事實上沒那麼單純.

這跟一般人在做軟體不一樣, 甚至在做網站也不一樣, 在這個如此多元的資料格式, 不穩定的資料源來實作, 若沒有去接觸真實的資料端, 很難去了解與面對這資料的困難度與複雜性, 且加上這系統本身應該是由資料開始去規劃, 然後往想要解決的目標去進行, 在某方面是這種 Down-Top 的設計思維, 須要的是 "實作的能力" 以及 "目標的認知".

在這實作的經驗中, 我把過程分成幾階段:

搜集資料: 如何透過公開內容去搜集與建立字詞資料庫, 如何透過 API 去抓使用者資料, 這些不只要面對 "格式", 更要解決 "方法", 其中還有一個可怕的環節: "臉書最難捉摸的API" 可以說是被這事折騰了很久.

儲存資料: 在某方面, 這是須要很多 Know-How 的, 但相對的也是較為單純的, 因為通常儲存資料都是在自己這邊, 選擇那些資料庫, 那些儲存與讀取方法雖然是跟系統有關, 跟資料使用方式有關, 只要有經驗問題都不大.

除錯資料: 如同前面所說的, 格式來源都不穩定的情型下, 如何判斷那些資料是正確的, 尤其在 Big Data 中, 最須要的是 "Aggregation", 也就是聚合, 把相同點找出來判讀成一件事, 例如要找出那些網址事實上在說同一件事, 這在實作過程中是遇到最多的調整工夫.

計算資料: 通常說計算資料有時候是最簡單的, 因為這些 Know-How 只要多看幾本書就可以了, 尤其是在模型的判讀, 選擇與檢核要有能力, 但這也是最吃能力的, 因為沒有選對好的演算法與模型, 很多事情都很難真的準確, 我也還須要在這方面有更多的學習.

呈現資料: 這呈現資料不是單純的 UI, 或是 Visualization, 還包含資料在不同的使用情境, 須求有不同的觀點, 在這系統我實作了不少方式, 但最後也有發行後發現更好改善後放棄的, 也就是說 Presentation 呈現是面對 Scenario 情境多元時要如何選擇這議題, 這也是系統最後功能決勝點.

解讀資料: 有時系統做出來時, 會出現超乎你預期的結果, 有些可能是單純有 Bug 錯誤, 有時是演算法不夠解讀, 但更有可能的是必須在透過人的解讀中, 找到新的發法或開發新系統, 這也是所謂 Data Scientist 的能力差異之一.

在經過這幾個 Data 環節中, 一步步往目標前進, 單單這個系統, 離最初的命題大概是 100 分中已完成 3~4 分, 也就是連 5% 都還不到, 雖然現在已經做到一件很重要的事:

"已經知道台灣臉書熱門的話題是那些"

雖然這成就已經解開, 但也至少要有 20 個以上的成就解開才勉強可以道白金殿堂吧, 加油吧, 林克....

後記: 本來覺得這是老生常談, 類似的觀點已經寫不只三次了, 但看到 CK 一直在寫相關文章, 尤其是這篇 "資料分析的三個層次", 看了我有很大的感觸, 因為要完成這樣的事情, 真的須要 Read the Data, Read Between the Data, Read Beyond the Data 的能力阿.

2013年11月10日 星期日

了解你與你的朋友是在支持還是在尊重同志....

在觀察好一陣子的熱門話題, 發現這次多元成家的議題熱度一直延燒, 但到底熱度是如何, 或者是那一方的支持群眾比較多, 該如何用數量去衡量, 此時我就有點好奇了, 因此也就用這議題寫了一個程式來做分析.

在 "林克傳說" 有一個很重要的立論基礎, 就是 "近朱者赤" 或者是 "近貘者黑", 但更重要的是, 相信人會不自覺得選擇與過濾與自己相同與相反的言論, 所以對最後都只剩下不會與自己本身個性或意見差太多的言論.

就像是我剛剛有一個朋友, 被我發現他的社會批判性比我預期的還強, 他就說一定要低調, 但我說在這種系統的演算法觀點, 低調是沒有用的, 畢竟算的不是他的言論, 他的分享只占他與所有朋友總數分之一而已, 即使發言有所選擇, 但無法去控制別人說的或自己看的東西.

就像是人會自我審查 (這又是另一個人說的), 人眼中的資訊會影響你, 相對的也是你在對他投一票,  有時人的行為本來就可以分很多層次:

1. 閱讀
2. 按讚
3. 搜尋
4. 留言
5. 分享
6. 發表
7. 行動

這七種層級各有其數量級的差異, 無論是數量與效力, 當然每一種媒質在這幾種行為還是有差別, 在計算與轉換都不太一樣.

Anyway, 這篇文章不是要討論這議題, 只是給大家一個基本了解.

這系統是算你與你的朋友分享的資訊中, 有多少比例是 "支持" 同志或其他的多元成家, 還是 "尊重" 同志認為社會傳統秩序更重要的, 在這邊雖然我不表明立場, 因為我更希望大家知道這系統的背後意義.

但我也知道系統的實作即使是種觀察, 但也是種社會宣示, 即使我在這雙方爭論不直接表示立場, 但我也說: "我們可以透過系統去更了解自己, 朋友與社會", 這也是這系統的初衷之一, 如同在系統後面的 Quote:

但也不要以為選擇較輕鬆的路是對的, 就隨波逐流, 人云亦云
這社會倒底是要維持單一有秩序的社會, 還是讓每個人可以選擇自己的路
很多事決定在我們的選擇, 這系統能做的就是讓你有更多資訊來選擇

畢竟單單做這個系統, 對我而言也是種社會工作阿, 而我的所謂社會工作只能對我期望的社會做付出, 而不該是去假設 "大好 (Greater Good)", 因為這樣會抹殺別人做社會工作的價值阿~~~

記: 這系統的工人智慧是由 梅子 提供, 感謝她...

阿, 忘了說, 網址是 http://link.que.tw/glaad.php 感謝 Ken Hsu 提醒....

2013年11月5日 星期二

今天臉書上很紅的兩個藝人, 張懸與郭采潔, 來看議題的不平等性

今天臉書上有兩個藝人很紅, 一個是說 "My Hometown" 的張懸, 另一個是 "悍衛傳統道德" 的郭采潔, 因為她們的表態, 造成臉書很大的風波...

這兩件事剛好都是 "言論自由" 很好的例子, 一個是 "中國" vs "台灣" 的意識問題, 一個是 "主流基督徒" vs "同志支持者" 的意識問題, 這兩個陣營在不同地區都有不同的勢力, 都有自己的支持者與反對這, 在臉書這樣的社群都有不同的效應.

這議題看起來都差很多, 但有一個共同點是: 有一方不贊成(甚至想抹殺)另一方的存在, 也就說這不是個對雙方都是對等的議題, 而是若某一方支持若成立的話, 另一方就失去立場, 我們估且說成甲方與乙方:

甲方: 表面尊重乙方, 但認為乙方不該擁有跟甲方相同的權利
乙方: 想要擁有跟甲方平等的權利, 但受到既有特權的壓迫

在這次的事件中, 剛好兩個藝人身處不同的甲方與乙方, 雖然說在社群中, 因為社群有偏向弱勢的慣性, 乙方通常得利, 但甲方通常擁有優勢, 畢竟這議題原本就是乙方想要獲得平等的題目, 代表原本乙方是屈於劣勢, 所以甲方很簡單的可以用 "不該討論", "維持既有" 的手段來運作.

在這邊對應的是:

兩岸議題:
甲方: 不應該討論政治議題, 台灣本來就不是獨立的國家.
乙方: 台灣擁有自己獨立的政府, 土地與人民, 為甚麼不是國家?

同志議題:
甲方: 我們相當尊重同志, 但同志本來就不應該擁有家庭與婚姻的保障.
乙方: 我們是相愛的人, 為甚麼沒有權力去結合.

雖然說, 在 "言論自由" 中, 不應該是保障或提出 "抹滅對方存在意圖" 的言論, 或者是說 "對方不應該擁有相同權力" 的主張, 不論是基於宗教, 性別, 等等, 事實上這問題早就發生過很多次災難了:

甲方: 德意志民族是最優秀的種族, 相對劣等的猶太族沒有權力活在世界上.
甲方: 男人本來就是擁有智慧的社會支柱, 女性跟本不須要接受教育.
甲方: 黑人是無法自我學習的人種, 很合適於當奴隸.

在這邊並不是要去把那一位藝人去 "標籤" 成跟歷史上的罪人一樣的立場, 只是要說明這議題並不是罕見, 而是一直存在著.

雖然說, 這兩個議題在雙方各有不同的立場與說法, 我在這邊也沒必要多說明, 因為單單透過我剛寫的 "林克傳說 (暫定)" 就可以看得出來, 這種不平等的議題到處存在, 也包含 "大是大非" 的 "這不是關說不然甚麼叫關說" 的類似議題 (但還是不太一樣).

這樣的議題我並不是要說誰是誰非, 而是要讓大家知道這不是對等的雙方觀點的議題, 而是在於一個不對等的甲方強制乙方的議題, 但我也不敢說這種議題是對是錯, 也包含 "甲方" 到底有沒有強制性 (強制力), 但若甲方認為這是 "平等的雙方", 這就是錯了, 因為甲方擁有既有的優勢, 且目的是要否定乙方的議題, 而乙方即使得到認同, 甲方不會受到不平等的壓迫, 但乙方卻是會的.

因此說, 的確言論是自由的, 但的確有時我們面臨到不平等的言論時, 更該要小心, 就像是有人說: "在台上的人更須要認真的廎聽", 事實上我們更應該要做的是 "平等的對談", 若雙方不在一個平等的立場來 "對話", 而是用既有的優勢來 "訓話", 就很容易陷入 "言論自由" 的謬論.

但, 人身攻擊 或 因為對方的立場來決定其價值 的言論, 更是不可取的另一件事, 這邊就不多說了.

張懸圖出處: http://www.nownews.com/n/2012/09/25/234712
郭彩潔圖出處: https://www.facebook.com/photo.php?fbid=10152304415196521&set=a.10151956470266521.1073741825.111171231520&type=1

下圖為發文時的臉書外部分享排行榜:



熱門文章