今天寫了七篇文章, 分散在四個部落格, 其中最主要是在 "部落格觀察部落格" 公布了很多事情的關係, 而在晚上時分, 也一面做事一面看了四部電影, 寫了或改寫了三個程式, 其中就是終於算出第二次宅度計中部落格關鍵字的關聯分析, ...
這一次跟上一次有甚麼不一樣呢?
1. 加了時間這個參數
2. 對於被配對的部落格, 對於關鍵字較重的給予一個小加權
所以這個部落格第二次的關鍵字關聯分析是:
跟上一次的計算, 或多或少有些小差異, 但因為有些部份是因為時間還不夠久把舊資料清掉, 所以還是有些較久沒更新的部落格在裏面, 但我相信一個月後這些部落格應該就會不見了..
這次的計算跟在 B 公司的演算法, 最主要的差別是在加權, 當時並沒有對較高屬性的物件做加重, 這次則是有了, 這也是代表的即使是相同的 Data Mining 資料探勘的 Relation Analysis 關聯分析, 一樣的二元關係資料庫, 但在不同的物件與屬性, 會有不同的計算模型與加權, 真是有趣阿...
2008年8月19日 星期二
訂閱:
張貼留言 (Atom)
熱門文章
-
在開始寫這篇之前, 先弄個小 box 讓大家回顧之前有關 網站完全評點 (原SEO鑑價系統) 的文章: 對黑帽 SEO 的回應 (SEO 鑑價系統的初探 I) 內容關鍵字的數量與比例 (SEO 鑑價系統的初探 II) 你找的 SEO 公司真的有成效嗎? (SEO 鑑價...
-
剛不小心去按 plurk, 發現跑出一段 error code: Traceback (most recent call last): File "/home/plurk/plurk/production/releases/20090104210908/ext/part...
-
當我們做出一個系統, 最希望知道的是有沒有檢定判讀的能力, 不然價值與意義就會少很多, 而在做未來國會的時候, 很多人問我, 網路聲量是否能夠轉化成得票數? 事實上我也是很好奇.... 首先一開始, 就直接算出得票數與網路聲量的相關性 (相關係數), 得出來的答案是: ...
-
會取名網事是有原因的, 不單純的只是 "網站的事情", 也是因為我習慣用雙關語與諧音來命名的關係, 因此這個 "往事" 也代表來看過去, 從看過去的事, 來做現在的事, 因而決定未來. 因此會有一個很有趣的功能, 也就是我很喜歡的數...
-
依 IMDB 超過 1 萬人以上評分的順序 降世神通 1. 9.3 Avatar 降世神通 2. 9.2 Ricky and Moorty 3. 9.1 鋼之鍊金術師 Brotherhood 4. 9.0 進擊的巨人 5. 9.0 獵人 6. 9.0 死亡筆記本 11. 8.8 ...
-
民進黨為了要決定提名,因此辦了民意調查,來決定候選人,而公布高雄市的民調時,嘗試跟 "專頁儀表板" 做了個比較,發現相關性達到 0.99 以上這個令人吃驚的事,但第二天台南的民調跟專頁儀表板的相關性只有 0.03,這數字可以說是完全無關,而 0.99 的相關性...
-
我們都知道網路詐騙是一個很嚴重的問題, 不下於假新聞, 雖然這些事都不是在網路上獨特的社會現像, 因為在現實社會這些欺騙的事層出不窮, 但透過網路的高效率散播, 有時比現實社會來得嚴重. 在臉書投廣告, 大部份都是須要透過粉絲團來操作, 若是我們能夠 "定位...
-
很多人以為實況投票只是一個浪費頻寬的工具, 雖然這是真的, 畢竟若只是一張圖, 上面就是幾個數字跳來跳去, 我真的不知道這是為了做甚麼? 況且這些投票, 本來就存在粉絲團本來的結構性偏差, 動員力量的問題, 甚至還有人把 "讚" 的選項做進去, 這不是刻意誤導...
-
目前已知道 Formula/Equation 是: 1. Unemployment: ind*3+com-pop (分母是Pop) 2. Transportation: tra*5+100-pop (分母是Pop) 3. Criminality: sec*4+300-pop (分...
-
專頁儀表板除了作為社群編輯的工具外,更想做的是想要成為 "透過社群來了解社會" 的儀表板,因此對於 "屬性" 上做了各個面相的定義,除了常見的分類外,更重要的是依立場,議題來去 "標籤"。 因此會有 "...
網誌管理員已經移除這則留言。
回覆刪除