今天寫了七篇文章, 分散在四個部落格, 其中最主要是在 "部落格觀察部落格" 公布了很多事情的關係, 而在晚上時分, 也一面做事一面看了四部電影, 寫了或改寫了三個程式, 其中就是終於算出第二次宅度計中部落格關鍵字的關聯分析, ...
這一次跟上一次有甚麼不一樣呢?
1. 加了時間這個參數
2. 對於被配對的部落格, 對於關鍵字較重的給予一個小加權
所以這個部落格第二次的關鍵字關聯分析是:
跟上一次的計算, 或多或少有些小差異, 但因為有些部份是因為時間還不夠久把舊資料清掉, 所以還是有些較久沒更新的部落格在裏面, 但我相信一個月後這些部落格應該就會不見了..
這次的計算跟在 B 公司的演算法, 最主要的差別是在加權, 當時並沒有對較高屬性的物件做加重, 這次則是有了, 這也是代表的即使是相同的 Data Mining 資料探勘的 Relation Analysis 關聯分析, 一樣的二元關係資料庫, 但在不同的物件與屬性, 會有不同的計算模型與加權, 真是有趣阿...
2008年8月19日 星期二
訂閱:
張貼留言 (Atom)
熱門文章
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
有時我總對自己做的東西沒甚麼信心, 從 Plurk.tw 一直到做了很多延伸的應用, 尤其自己知道美工排版不行, 所以常找人合作, 其中一個東西就是 "噗熱浪"... 事實上 Plurk.tw 比 Plurktop 還早做, 當然我們這邊只能從發文說開始運作開...
-
我是不做 "Me,too" 的, 但我知道粉絲團經營最重要的共同指標, 一個是觸及數, 另一個是互動數, 但這數字只有經營者知道, 即使從洞察報告可以看到你加觀察的幾個粉絲團, 最近文章的互動狀況, 但還是離真的狀況有點距離, 除外粉絲團可以比較的就是 ...
-
在系統調校的一開始, 我一定會問大家一個問題: "系統負荷 60% 是過高還是過低呢? 系統負荷 6% 是過高還是過低呢?" 當然這個 "過高過低" 指的是一種不正常的現像, 而在之前要有一個前提: "何謂不正常?", ...
-
總統府網站雖然相較很多網站並不是那麼重要, 但也因為其特殊性以及政治立場的角色, 是很容易一直被拿出來討論的, 至少這幾天就 Alexa 的觀點來看, 從 3000 名外進到 3000 名內 (見右圖), 流量也瞬間多了四倍, 也可以當作是一個小型的壓力測試了.. 至少這段時間也...
-
終於收到 活力藥師網 - Yahoo!奇摩部落格 , 來信詢問, 他對於他的 Blog 有如此多的人在觀看, 但名次如此低, 非常不解.... 事實上就記錄來看, 11/05 時是 5081(19.77%) 到 02/04 時是 4270(68.57%) 了, 換句話說是這三...
-
我們都知道網路詐騙是一個很嚴重的問題, 不下於假新聞, 雖然這些事都不是在網路上獨特的社會現像, 因為在現實社會這些欺騙的事層出不窮, 但透過網路的高效率散播, 有時比現實社會來得嚴重. 在臉書投廣告, 大部份都是須要透過粉絲團來操作, 若是我們能夠 "定位...
-
之前寫了一篇 "聲援" Mr.6 的文章, 事實上問我有沒有在看 Mr.6 的文章, 有沒有在去 Mr.6 的聚會, 當然是沒有的, 只是看到很多人為了打壓 Mr.6 Over-Rated (過譽) 而來 Under-Rated (過惡) 想來個持平的說法罷了...
-
目前已知道 Formula/Equation 是: 1. Unemployment: ind*3+com-pop (分母是Pop) 2. Transportation: tra*5+100-pop (分母是Pop) 3. Criminality: sec*4+300-pop (分...
-
專頁儀表板除了作為社群編輯的工具外,更想做的是想要成為 "透過社群來了解社會" 的儀表板,因此對於 "屬性" 上做了各個面相的定義,除了常見的分類外,更重要的是依立場,議題來去 "標籤"。 因此會有 "...
網誌管理員已經移除這則留言。
回覆刪除