今天寫了七篇文章, 分散在四個部落格, 其中最主要是在 "部落格觀察部落格" 公布了很多事情的關係, 而在晚上時分, 也一面做事一面看了四部電影, 寫了或改寫了三個程式, 其中就是終於算出第二次宅度計中部落格關鍵字的關聯分析, ...
這一次跟上一次有甚麼不一樣呢?
1. 加了時間這個參數
2. 對於被配對的部落格, 對於關鍵字較重的給予一個小加權
所以這個部落格第二次的關鍵字關聯分析是:
跟上一次的計算, 或多或少有些小差異, 但因為有些部份是因為時間還不夠久把舊資料清掉, 所以還是有些較久沒更新的部落格在裏面, 但我相信一個月後這些部落格應該就會不見了..
這次的計算跟在 B 公司的演算法, 最主要的差別是在加權, 當時並沒有對較高屬性的物件做加重, 這次則是有了, 這也是代表的即使是相同的 Data Mining 資料探勘的 Relation Analysis 關聯分析, 一樣的二元關係資料庫, 但在不同的物件與屬性, 會有不同的計算模型與加權, 真是有趣阿...
網誌管理員已經移除這則留言。
回覆刪除