2008年1月30日 星期三

Firewall 的網卡

我在 2 年前的時候, 因為開始寫 iTHome 的部落格, 所以寫了一些 IT 經驗實務性的東西, 當時寫了有關 SLB (Server Load Balancing) 等的東西, 而之後, 因為部落格觀察的東西, 事實上也做了不少有關 Firewall 的實務, 讓我想到 N 年前的時候, 我在幫某網站做所謂的 Streaming 的 DRM 的時候, 用的就是所謂 Dynamic Firewall 來實作的, ...

部落格觀察這系統最可怕的地方就是很容易受到攻擊, 但與其說是受到攻擊, 還不如說是 "Collateral Damage (間接傷害)", 因為貼紙的關係, 有些有貼貼紙的部落格被掃站的時候, 部落格觀察也跟著被掃了, 所以在這邊 Firewall 的控制變得很重要, 在加上部落格觀察是個非營利的組織, 所以不太可能花錢買 Firewall, 所以實作了很多程式去防止 DOS/DDOS 的攻擊...

但這部份在某方面不方便 Open Source, 畢竟這都是窮人的方法, 甚至是說真正的 Hacker 是很輕易的看到 Source 見招拆招, 因為這個也是見招拆招的方法, 但相當有效是真的, 所以若有那些人受到 DOS/DDOS 之苦, 可以跟我講, 我會看情型給予不同的建議...

只是在 2 年前提到的網卡, 現在呢? 當然現在選擇變多了些, 而我在這邊找到列出來, 當然最重要的是..

1. Power Failure by Pass
2. Watch Dog
3. Good Giga Ethernet Controller Chipset

而在這邊列一下, 給大家在購買自製 Firewall 的網卡做參考, 這樣也可以不用 5 萬的預算, 輕易做出百萬等級的 Firewall 了...

1. Portwell ABN-192 Dual-Port 64-bit Gigabit Ethernet Adaptor with Bypass Function
2. Silicom PEG4BPiL Quad Port Copper Gigabit Ethernet PCI Express Bypass Server Adapter Intel®
3. iEi MLAN-1000 Quad Intel® 82540 Gigabit LAN Card with Bypass function

當然像這樣的網卡應該還很多, 但不知道大家用的經驗如何? 像我確定 iEi 這張跑 FreeBSD 沒問題, 當時還是冒風險買的, 因為不給借測, 當時買一張記得還要 4000 以上吧, 但幸好可以跑, 不然就糗大了~~~

這三張 iEi 是用 82540EM, Silicom 是用 82575, 而 Portwell 是用 82546GB, 當然就型號看起來似乎是 Silicom 用的較好, 但說真的, 我看到有不少人對這些晶片十分了解, 我在這邊就不敢班門弄斧, 畢竟這還是真的要實測才會知道, 不能是只有比數字大小吧(?), 或許~~~

2008年1月24日 星期四

你我的小城市 mmc.urs.tw (myminicity)

會做這個系統也是因為自己用來玩的, 想要知道自己的進步狀況, 能不能追得上排名前面的進步狀況, 自然還會畫出成長趨勢的 widget 等等的想法, 跟原本幾個 widget 出發點不一樣, ...

除外, 最主要就是 "工作清單", 也就是一個列表記錄自己今天該踩那些城市以及踩過那些, 這樣就不會多踩或少踩, 所以這個 "mmc.urs.tw 你我的小城市" 意外計劃就出現了...

而這個是前天開始做的, 因此歷史記錄還沒辦法累積到畫圖, 相對的 widget 也要累積才會有數字的情型下就再等等吧, 但這個 "check list" 已經就做完了, 詳細部份有兩位朋友都寫了教學了, 我就不多說了..
【教學】Your MyMiniCity的使用方法
MyMinicity姊妹城市清單網站上線,一次方便點選所有好友的小城市
感謝這兩位朋友, 但除了可以有清單可以踩之外, 我也做了個小連結, 就是 "http://mmc.urs.tw/c/genehong" 這樣的連結, 這個連結最大的好處就會幫你看目前的狀況, 自動分配使用者該踩那一種建設而不至於到最後都搬家了, 當然前題也是必須要有登入才會有資料, 不然的話就一定會踩 tra(nsport), 因為那個不到 100....:)



這個是我目前 http://bloglook.myminicity.com/ 的狀況, 市中心最繁榮也是剛出現三間大樓, 不像有些人才只有 700 人時就有直升機大廈了, 大概是我的 transport 做太好了吧...

CityBlogLookRankingNow: 11Yesterday: 18
ItemsThis HourLast HourTodayTotal
Population8713510142901
Incomes1305020650280700791850
Construct0213154383
Commerce0--89313
Enviorment0--4161553
Industry0--372926
Security0--264661
Traffic0--174930

2008年1月18日 星期五

三螢幕開始... 開始想像像劍魚的多螢幕了~~

這句話已經喊了不知多久了, 當時聽到 LG 出了一款可以 USB 連結的 LCD, 想說這真的是太好了, ... 但沒想到還沒真的上市就腰斬了(?), 後來找到原來這技術是一家叫 Display Link 的公司, 做的...

而我在兩年多前就開始採用雙螢幕, 而現在若是沒用雙螢幕我還真得覺得效率真的很差, 而原本是想說或許等 Kensington 也有一款叫 Notebook Expansion Dock with Video, 雖然台灣有代理商, 但很不幸的這款沒有進...

我找了很久, 看到 PCHome 有一款 IOGEAR 的 USB2.0外接式VGA顯示卡 (GUC2015V), 本來是可以買的, 但一刷完卡後就變成 "售完補貨中", 還真的是一波三折阿...

最後是看到 NeoPlus 有代理一款這樣的商品, 而原本是想請癮科技的同事來借測的, 但大概他們只是經銷商, 不了解 PR 的價值, 所以最後我只好自己去露天買了...

而下面的圖是我在 B公司克難的弄出一個三螢幕拿來用, 只是要問我現在用得如何, 我還不確定啦, 只是我覺得 DisplayLink 或 Kensington 應該要好好請我寫介紹文是真的, ...

來玩 MyMinicity

就部觀門的觀察而言, MyMiniCity 最早是從去年 12/18 開始有人查詢的, 目前單一天最高是今年 1/10 的單日 29 次, ...

而我則是昨天在審查部落個觀察的資料看到的, 而今天 (1/17) 才開始玩, 所以真的是後知後覺了...

而我現在的城市目前狀況是這樣子的....




不知有多少人在玩, 來幫我點一下吧, 事實上我真的除了玩以外, 也在開始認真的考慮 doom.urs.tw 計劃了, 我相信這個做起來一定會比 myminicity 有趣太多了...

2008年1月16日 星期三

Pagerank 又開始在跳動了...

大概是 15 號中午時分, 我是先發現 工程師級的顧問 / 【食夢黑貘】的 Pagerank 從 3 分變成 4 分, 雖然這沒甚麼好高興的, 因為原本是 5 分被扣成 3 分的, 但因此知道 Pagerank 又再跳動了, 所以查一下所有部落格上週到這週的變化...

7 分的從 2 個變成 1 個
6 分的保持 13 個沒有變化 (事實上只剩 6 個, 因為有 6 個是收起來, 且有 1 個網址失效)
5 分的從 55 個減少成 41 個
4 分的從 597 個銳減成 472 個

其中大概變化最大的是 simon 的 adsense-tw.blogspot 被歸零是除了把站廢掉, 或關閉成隱型外, 減少最多的一位, ...

這次進步的, 反倒是都是上次原本從 3 分或 4 分被歸零後, 調回原本分數的, 包含, Sounds and Fury - 樂多日誌, 草本新鮮‧b, appleseed, 蘋果核 - 樂多日誌 等等...

但還是有誤判的現像存在, 例如不少關站的在這個短時間變成 6 分, 例如 摩庫在 xuite, ....

而這次聽說 Google 有例用 IP 同一組 Class 以及 whois database 的類似註冊名字或同一組 DNS 採取扣分的動作, 這個是否真實或傳聞, 比較無法得知, 但說真的, 努力寫作與創作才是王道...

2008年1月11日 星期五

事出必有因, Nothing Comes From Nothing

有些人看完 "部落格足跡" 後, 大部份都是 "好像有點準, 但好像有點奇怪", "有些本來早就知道, 但有些莫明奇妙", "有些說得過去, 有些不知道原因" 這樣的說法, 當然大部份都是說 "週統計得前幾名是很準, 但其他就搞不懂" 這樣的問題..

事實上這也是我在做這個計劃時, 就知道當做到一定天數的統計時, 前幾名是 "理所當然", "早就知道", 等等的狀況, 但刻意的算出每天, 就是不想要如此收斂, 不然就太無趣了....

但與其說收斂, 還不如說是所有算出的數字都是有原因的, 只是這個原因是甚麼? 甚至說玄一點的就是 "機緣" 或 "因緣" 的可能性還較高些, 畢竟這些事物的跡徵都是成千上萬的, 為甚麼上萬個部落格算出來, 就是這些部落格在前 20 名 (有人建議我提高到 30 名), 我可以肯定的我不是用亂數來擲骰子的....

當然說這演算法是否有暇疵, 我是不否認, 因為可以調整的參數與演算法還很多, 但我是盡量讓數字來說話, 而不是先見的假設答案來自圓其說, 甚至應該是說因為這樣的結果, 不少讓我無法解釋的...

所以只好祭出我的網管第一定律: "Nothing Comes From Nothing", 來說這是一個已知或未知的答案, 但可以肯定的是 "Nothing Ever Could" 後必然有 "Something"....

若是還不了解我在說甚麼的話, 只好請大家看這段 Youtube 影片了, 我相信從這段影片, 大家必然可以更了解 "Nothing Comes From Nothing" 在說甚麼了...

2008年1月10日 星期四

部落格因足跡在一起 (I)

有些人知道我的專長絕對不是 "行銷", 雖然我唸了 7 年的管理學院, 包含資管系所與管理科學等, 但與其討論是否善長 "行銷", 還不如說我更相信 "技術" 帶來對人的幫助, 包含 "行銷"....

所以我現在都只說, 我的專長是在 "預測" 以及背後的技術, 只是這背後包含的技術有 "數學", "高效能運算", "系統調校", "統計", 等等的東西, 或者以現在的觀點稱為 "資料探勘" 或者是較早稱為 "資訊獲取 (Information Retrieving) " 的無聊名詞.

因此很多人以為我會把部落格觀察所獲得的資料拿來 "採礦", 但過了一年多後, 終於推出一個叫 "部落格足跡" 的計劃, 這個才是在我的觀點是第一個有兩階層以上計算的 "資料探勘" 的應用, 為甚麼呢? 因為部落格觀察一直在跟資源作奮戰, 而 Data Mining 基本上是很吃資源的, 所以說要真的去計算甚麼東西, 是不太可能的, 所以一直到有別的單位支持這計劃才得以實現.

若是說 "Birds of a Feather Flock Together" 的話, 這個計劃就是 "Blogs of a Foot Flock Together", 也就是說, 鳥若是因為羽毛來決定屬性的話, 部落格就是靠足跡, 而這個足跡在這個計劃定義為 "讀者"....

也就是說這個系統就是計算 "讀者的交集度" 來決定 "部落格的關係度", 這聽起來很單純, 只是甚麼是 "讀者的交集度" 呢? 我這邊來說的較複雜一點好了:

若你的部落格 A 有 500 個讀者, 而有個部落格 B 有 300 個讀者, 且其中 200 個你是相同的, 所以你們之間的交集度可以定義為 sqrt(200^2/(500*300)) = 0.5163.... , 就是有 0.52 的交集度, 若是有另一個部落格 C 有 1000 個讀者, 跟你的部落格交集有 300 個, 則交集度是 sqrt(300^2/(500*1000)) = 0.4242... , 也就是 0.42 的交集度, 自然前者雖然相同的讀者數較少, 但比例較高, 自然交集度較高..

而在部落格觀察的貼紙中, 每天有上萬個部落格被點閱, 而這系統就計算出你跟這上萬個部落格的交集度後, 排出排行榜出來, 而這種方法在資料探勘是最基本的 "關聯度分析", 只是如何在每天有數百萬點閱數中找出這些資料, 才是挑戰, 甚至我們計算所謂每天的資料, 並不只計算單一天而已, 而是一個星期, 也就是這是數千萬筆資料的計算~~~~

但怎樣計算並不重要, 而是算出來後代表的是甚麼或能夠拿來作甚麼...

1. 讀者交集度越高, 代表這兩個部落格族群重疊度越高...
2. 可以拿來作延伸閱讀...
3. 對於只會悶著頭寫的部落客, 可以看看還有那些部落格是跟你很像的?
4. 去拜訪與認識那些理論上跟你比較近的部落格或部落客.

而這個系統在昨天寫出週統計後, 整體雛型就完成了大半, 然後就是呈現的方式了, ...

因為昨天跟 686 提到這個, 我就拿他的來舉例好了, 大家可以直接點去看, 而在週排行的前 5 名為:

1. 小小書房|因為對書的愛情,我們存在 => 58
2. 薄荷奶茶部落格 - :: PIXNET BLOG :: => 54
3. 乖 - 天空部落 => 44
4. 富爾豪斯的舞寺參世界 ::PIXNET 痞客邦:: => 40
5. 四貓之母居所 - Yahoo!奇摩部落格 => 34

在每日排行榜中, 我們有濾掉只剩個人部落格, 但在週排行就沒有, 而跟 有河book 最接近的說是 "小小書房" 應該沒有人否定吧? 而之後的部落格有貓的, 有旅遊的, 但除外還有一個是相簿的, 而之間有甚麼關係我是不知道, ....

若是看這個部落格(黑貘來說) 的話, 前 8 名為:

1. 新台灣* Web 2.0 觀察表 Beta mk2 => 65
2. 大明攝影日誌 ::PIXNET 痞客邦:: => 38
3. 放逐流浪異鄉的旅人啊 => 35
4. 工程師級的顧問 / 【食夢黑貘】 => 35
5. 灰頭土臉:Xuite日誌 => 35
6. MyZilla Wiki: Welcome! => 34
7. 影音"不落格",許多音樂、mv,歡迎你的 => 33
8. 不是捷運日記 => 33

這 8 個有 4 個是我自己的部落格, 所以有時跟連結有相當大的相關, 畢竟為甚麼讀者會交集, 通常是有相互連結或介紹, 或者是跟本是同一個族群或是本人自己的創作, 都可以由這個看出來...

只是這個系統目前只是 beta 的 alpha 的測試版, 所以有甚麼想法可以跟我講~~~

2008年1月8日 星期二

從極忙到掛病號

去年的耶誕節我是在 "拉拉山" 上度過的, 呼吸到國家公園級的新鮮空氣後回到平地繼續努力工作, 但沒想到 12/29 號部落格觀察最早的機器開始不穩, 一直到第二天去機房確認放棄, 現在還是在起不能狀態, 因此在沒心思過年的情型一轉眼間就到了 5 號, ....

但說 5 號之後似乎沒事是想太多了, 三個同事還殺到我家寫 SA/SD, 但到 20:00 後我確定已經進入半昏迷的沒有戰力現像~~~

第二天狂睡 13 小時, 至少這是星期天且把胃與食道的不舒服給睡掉, 精神原本感覺好多了, 只是跑出了咳嗽~~~~

星期一照樣去博客來上班, 雖然沒做甚麼事, 只是開會, 但也談不上不舒服, 但咳嗽的問題更為嚴重些, 雖然跟冬天的過敏咳嗽是好太多了, 這可能是不幸的大幸..

中午起床後, 整個人一直酸痛, 本想在 12:30 前出門, 但一整個賴在沙發就到了 2:30, 幾乎快看完 "Tremors 2" (從地心竄出2), 只是想想還是不行, 就拖著疲憊的身體出門了, ...

在捷運上還發現機器又給我掛了, 一整個 orz, 到公司, 雖然是有做到有價值的事, 但在 17:00 後就昏昏欲睡, 但要我那時坐捷運是百般不願意, 只好睡到 7:30 才離開辦公室...

雖然是很慘的狀況, 本來想去板橋買東西, 但後來沒精力只好作罷, 但很幸運的在露天看到相同的東西且少了 1000 元以上, 我想這是最大的收獲吧...

這個部落格已經快 1 個月沒寫東西, 說真的不是沒甚麼不寫的, 只是有時覺得自己一個人以外還有更多事要說出來, 所以都寫在其他地方了, 但我只是把這個部落格定位在 MSN 的延伸, 因此這幾天的狀況是一定要說的啦~~~~

熱門文章