前幾天有一個很重要的事, 就是 M$ 自己做了一個 IE6 Countdoown 的網站, 希望在 2014 年能夠讓 IE6 從地球上消失, 但我這篇不是在寫 IE6, 雖然我是網站開發者, 只是我只處理到資料庫端而已, 所以我並沒有那麼痛恨 IE6, 所以當看完這網站我並沒有很大的想法.
但仔細看了一下這網站的數字, 這網站的資料是取自網路界鼎鼎有名的 Net Applications .com, 很多網路分析資料的數字都是取自於這間公司, 所以也沒甚麼好意外的, 而在一個噗浪的討論串中, 有人說了一句話: 亞洲好像是最慘的, 仔細一看, 亞洲說不定占了整個 IE6 的三分之二, 當然其中有一半要歸功於中國大陸.
討論到這邊, 台灣的狀況也沒好到那邊, 最後大家七嘴八舌的說台灣真正的問題不在民間, 而是在公家機關, 此時就講到這些政府單位的固步自封, 食古不化, 甚至到貪污腐敗的程度, 所以認真看了一下:
中國 34.5%
南韓 24.8%
印度 12.3%
台灣 10.7%
日本 10.3%
越南 10.0%
香港 7.6%
若不說這是 IE6 的占有率, 而是說公家機關的 "官僚度", 甚至說是 "資訊暢通率" 說不定有許多人會相信與認同.
事實上在任何數字背後都有其意義的, 這也是我常說的 "Nothing Comes From Nothing", 事出必有因, 很多事情無法確切的知道, 或者是量化的得到, 若是用另一個管道取得不同的資訊, 說不定真的可以參照.
而在這份數字中, 表現最好的是挪威與芬蘭都不到 1%, 這更似乎可以證明些甚麼的感覺, 但 IE6 的占有率應該是用兩個因子來造成的.
1. 資訊的利用率
2. 資訊的進化率
也就是說, 若都沒在用網路, 當然也不會有 IE6 的問題, 但若只知道使用網路, 而不知道去進化, 去更新, 這才是最糟糕的事, 我們很清楚的知道台灣的公家機關是如此, 但事實上也是人民, 廠商放任如此的結果, 也可以說這是社會的氛圍也不為過, 畢竟政府是我們選的, 我們建構的, 而從這邊倒是真的可以看清一些事情.
說到這邊, 大家應該會懷疑我的標題應該是 "從 IE6 來看台灣政治的困境" 這樣才對, 這也沒錯, 事實上我最近在玩一些數字的時候, 常常會面臨到一些問題, 雖然我們期望在資料探勘可以用較為 "平面" 的角度去抓取資料, 但事實上任何動作與行為都有出發點, 要能夠去避免偏見是不太可行, 只是這些也不是問題, 真正的問題是: "抓不到", 以及 "無法定義"...
尤其有些數字是人去填的, 就像是這次馬政府認定政見完成率有 88% 那樣, 說這是公正客觀的指標還不如說這是個話術比較實際, 因此有時候我們該去取樣的數字應該是更沒有立場的, 甚至是更大量的, 更即時的, 尤其若是用 "系統性", "自動化", "架構性" 的去抓這些數字, 能夠呈現的資料往往會超乎我們的想像.
例如我曾用噗浪去搜集過 "失眠", "感冒", "翻桌", "好熱", "下雨" 等等情緒性或較直接的現像的字詞計算來看社會, 有些是有點廢話, 當溫度交替時就會較多人感冒, 而我倒是想說若進一步的去搜集 "找工作", "失業", 說不定也可以呈現出社會的不同面與角度.
當然數字只是非常非常的表面, 不能用數字的表相來去看, 更應該像是統計去探索裏面的因子去做分析, 但這個倒不見的是 Data Mining 可以做的事, 畢竟有時我覺得資料探勘跟統計有點像 天文 vs 物理, 一個是你只能從觀察去找到答案, 另一個是可以去做實驗與驗証, 有時從這角度來看社會, 還覺得這個社會雖然說是個母體 (Matrix), 但說要去架構還真的不可能阿, 這也是人類有趣的地方.
下面是原噗的內容.
訂閱:
張貼留言 (Atom)
熱門文章
-
原本以為這程式是相當難寫的, 但在 AM 4:00 洗澡的時候, 仔細想想並不困難, 但應該說不困難的是在抓取, 但要顯示出有價值與意義的排行榜是相對困難的.... 後來花了不到半小時就有個雛型, 接下來就是顯示這排行榜, 而在昨天睡前 (AM 5:00) 時, 只是一個最近抓到...
-
現在是 3:42 分, 該睡了, 但一直想寫篇文章但都一直提不起勁, 大概是為了準備星期四博客來的會議, 讓整個心態與作息全部亂了, 在此時蛋捲個人站又掛了, 讓我的情續大概到了蠻低的低潮吧... 整個星期六日沒甚麼精神做事, 事實上大約在上星期二似乎就隨著部落格溫度計進到低點,...
-
這個計劃最出是我交大管科系學長所發生的問題, 因為我寫了一篇文章後, 就跑去 Plurk 跟大家討論, 而他是屬於會使用網路但不會使用 Plurk 的人, 所以跟本不知道 Plurk 講了甚麼, 最後我只好把網址給他, 他才晃然大悟這兩個部份的落差, 所以跟我抱怨這件事, 因此我...
-
基本上我是屬於逃避加無所謂鄉愿型的人, 所以即使罵我我也很難生氣, 但還是會難過, 只是比較不會生氣... 所以這次會把回應關起來, 當然不是有誰在說我壞話, 因為這很常見也很習慣, 但最近真的 Spam 廣告訊息真的太多了, 所以先將回應暫時設成 "審核制"...
-
以下的言論, 純以我是以一個工程師出身的網管, 也以做過 ISP 基礎建設的工作經驗來發言. 前一陣子有人提出取消手機網路不應該有吃到飽 (Flat Rate) 的奇想時, 有參與網路發展的人都知道, 這個固定費率的使用量是網路發展的推手, 或者是指標, 甚至是門檻, 若把這...
-
今天臉書上有兩個藝人很紅, 一個是說 "My Hometown" 的張懸, 另一個是 "悍衛傳統道德" 的郭采潔, 因為她們的表態, 造成臉書很大的風波... 這兩件事剛好都是 "言論自由" 很好的例子, 一個是...
-
沒有足夠資訊所做的判斷, 只是又再次增加錯誤的決策罷了.... 楊威利, 前十三艦隊軍團長 我們都知道要看一個網站經營, 最直接的就是看使用量或業績/利潤, 但這些只是最後的結果, 要知道如何改善, 還是須要很多細節去發現如何做, 網點就是因為這樣做出來的網...
-
從分家到現在, 我還是維持著兩個都有在更新的狀態, ... 也因為身份的關係, 也沒去說那家比較好... 但當天空吃下蕃薯藤後, 有好有壞, 但大多是壞處.. 1. 自由欄位最多 10 個, 事實上蠻不夠用的... 2. 輸入資料無法全選, 必須去動滑鼠去選擇... 3. 引用似...
-
很多人說 Google 會跳舞, 但事實上是真的嗎? 我們從部落格觀察來看 " 不只是捷運日記 " 的數字吧.. 日期 Google Page Google and Yahoo Link 目前 242 / 576 723 / 83440 ...
-
這幾個月一直看各個媒體在臉書的表現, 可以發現各個媒體的使用者介面與政策, 都會影響新聞在臉書的行為, 雖然有時是讀者的屬性做決定. 而一則新聞有時不用從內容, 甚至不用人去 "刻意投票", 我們就可以從臉書使用者的 "讚享評" 就...
用複回歸分析法去分析
回覆刪除IE6 的占有率,公家機關的官僚度, 資訊暢通率 的相關性,
或許可以得出很高的正相關??
『這個圖給我們一個啟示是: 有時候無法得知 A 的狀況, 但我們可以用可以探知的 B 的狀況評測之...』-> 我喜歡
回覆刪除Data Mining or Data Dredging ?
回覆刪除