今天寫了七篇文章, 分散在四個部落格, 其中最主要是在 "部落格觀察部落格" 公布了很多事情的關係, 而在晚上時分, 也一面做事一面看了四部電影, 寫了或改寫了三個程式, 其中就是終於算出第二次宅度計中部落格關鍵字的關聯分析, ...
這一次跟上一次有甚麼不一樣呢?
1. 加了時間這個參數
2. 對於被配對的部落格, 對於關鍵字較重的給予一個小加權
所以這個部落格第二次的關鍵字關聯分析是:
跟上一次的計算, 或多或少有些小差異, 但因為有些部份是因為時間還不夠久把舊資料清掉, 所以還是有些較久沒更新的部落格在裏面, 但我相信一個月後這些部落格應該就會不見了..
這次的計算跟在 B 公司的演算法, 最主要的差別是在加權, 當時並沒有對較高屬性的物件做加重, 這次則是有了, 這也是代表的即使是相同的 Data Mining 資料探勘的 Relation Analysis 關聯分析, 一樣的二元關係資料庫, 但在不同的物件與屬性, 會有不同的計算模型與加權, 真是有趣阿...
2008年8月19日 星期二
訂閱:
張貼留言 (Atom)
熱門文章
-
最近很火紅的一篇文章就是: " 為什麼我甘願花 8 萬僱用法國工程師,也不給兩個台灣年輕人機會? ", 這篇文章點出很多問題, 其中是下面三項是重點: 1. 全球性市場後的台灣競爭力 2. 英文的重要性 3. 台灣正規資訊教育的問題 這三個問題應該...
-
"若有一個像噗浪一樣好用的系統, 但有小圈圈的功能, 我二話不說一定會跳過去..."---- GH404X, 2009 (噗浪第一年) 在 Google+ 襲捲台灣不到兩個星期, 噗浪在 Alexa 跌了一名, Twitter 留言銳減, Facebook 有...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
大家還記得我在兩個月前寫了一篇 " 如何用網頁到網頁的延伸閱讀, 取代網站的交互連結 " 的文章嗎? 裏面談到兩個可能的發展性: 1. 共通 Tag : 這個沒甚麼了不起, Technorati 就是如此, 雖然這是很好的東西, 可惜沒人用了, 只是...
-
以下的言論, 純以我是以一個工程師出身的網管, 也以做過 ISP 基礎建設的工作經驗來發言. 前一陣子有人提出取消手機網路不應該有吃到飽 (Flat Rate) 的奇想時, 有參與網路發展的人都知道, 這個固定費率的使用量是網路發展的推手, 或者是指標, 甚至是門檻, 若把這...
-
這次莫拉克風災不得不否認的是政府處理真的有暇疵, 但我也不得不幫政府說句話, 因為若不是網路的關係, 事實上很多事都不會被發現, 更不會放大檢驗, 只能說運氣太差了.. 讓我想到三個月遇到某個公務人員長官, 他在會議提出一個嚴正的抗議與意見: "你們發展技術的人是如此的...
-
有人問我這次一例一休本來一開始民進黨如此的強勢, 但為甚麼如此呢? 記者對一例一休的文章數, 可以看到在 10 月之前有還是有在露出, 但在 10 月底才開始加碼... 主要是社群一開始沒甚麼熱度, 一直到 10 月底才開始... 即使是評論...
-
一些比較消息靈通的人都知道 Seednet 做了一個 TaiwanRank, 以自己用戶的使用狀況來作網站的另一種排名, 而目前推出的指標是 DNS 查詢數 及 不重覆IP 的兩個排行.. 有人問我這樣到底準不準阿? 事實上我常說, 沒有一種指標或觀點能夠覆概所有事情, 當然是越...
-
雖然台灣的資訊科技網站或部落格真的很多, 但仔細看, 不少都是 "全文翻譯" 國外的網站, 不加任何自己的想法, 不然就是為了寫而寫, 此時來看, 不要說是獨立思考的創見已經看不到, 連獨立寫作的內容已經消失了. 這篇文章我早在去年 11 月時就想寫了, ...
-
專頁儀表板除了作為社群編輯的工具外,更想做的是想要成為 "透過社群來了解社會" 的儀表板,因此對於 "屬性" 上做了各個面相的定義,除了常見的分類外,更重要的是依立場,議題來去 "標籤"。 因此會有 "...
網誌管理員已經移除這則留言。
回覆刪除