今天寫了七篇文章, 分散在四個部落格, 其中最主要是在 "部落格觀察部落格" 公布了很多事情的關係, 而在晚上時分, 也一面做事一面看了四部電影, 寫了或改寫了三個程式, 其中就是終於算出第二次宅度計中部落格關鍵字的關聯分析, ...
這一次跟上一次有甚麼不一樣呢?
1. 加了時間這個參數
2. 對於被配對的部落格, 對於關鍵字較重的給予一個小加權
所以這個部落格第二次的關鍵字關聯分析是:
跟上一次的計算, 或多或少有些小差異, 但因為有些部份是因為時間還不夠久把舊資料清掉, 所以還是有些較久沒更新的部落格在裏面, 但我相信一個月後這些部落格應該就會不見了..
這次的計算跟在 B 公司的演算法, 最主要的差別是在加權, 當時並沒有對較高屬性的物件做加重, 這次則是有了, 這也是代表的即使是相同的 Data Mining 資料探勘的 Relation Analysis 關聯分析, 一樣的二元關係資料庫, 但在不同的物件與屬性, 會有不同的計算模型與加權, 真是有趣阿...
2008年8月19日 星期二
訂閱:
張貼留言 (Atom)
熱門文章
-
在 Search Rank (SEO) 納入 Users Signal (使用者訊號) 之後, Click Through Rate (CTR) 變成了一個不在只是 UI/UX 的最愛, 更是 SEOers 不得不提的事了. 當然 CTR 不是只有注重 SEO 的人才須要注意...
-
在這個 Blog 我的定義是, 只要是常常被人問的問題, 若又被人問及的時候, 我就會寫篇文章叫他過來看, 而不是我再講一次, 畢竟每個人都要講一次也挺累的, 所以才叫 "Gene Oral Speaking", 本質上是說話的內容, 轉到 Blog 來寫作或...
-
專頁儀表板除了作為社群編輯的工具外,更想做的是想要成為 "透過社群來了解社會" 的儀表板,因此對於 "屬性" 上做了各個面相的定義,除了常見的分類外,更重要的是依立場,議題來去 "標籤"。 因此會有 "...
-
這幾天,公布了台南與高雄這兩個地方的民進黨內部的電話民調,雖然這跟真的投票沒有絕對關係,但做民調是很花成本的,當然除非有內參保密民調與對外公開民調外,民調還是很有效的 "政治工具"。 談論人數一直是很好的指標,尤其是在選舉的時候,因為選舉最後決勝負是得票數...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
剛看到無名決定恢復所謂的 "備份 XML" 的功能, 這個問題代表著甚麼呢? 就無名的觀點可能是這樣的: 1. 那些極少數網路異議份子是相當麻煩的. 2. 阻止大家搬家的陰謀被拆穿. 3. 就經過攻防的討論, 這議題吵下去會吃力不討好, 甚至會吃上官司. 但事...
-
在我寫出前言後, 當天晚上就把當時所說的數字的計算中兩個未寫入的就直接加進去後, 演算法就算是定型了, 然後就是未來的幾個部份: 1. 歷史: 當然每一週的變化是要可以記錄, 但是 "追加" 的部份怎記就是一個大問題. 2. Widget: 本來這系統正式要出...
-
網址: http://tag.analysis.tw/events/ [QOTD] 透過重組新聞讓選擇事件與議題交在讀者手上, 而不再是被記者或編輯決定, 或是被 "媒體財團老版" 指引. 從標籤的計數, 分數到計算被注目的爆發度, 進一步的透過等...
-
心情日記 是最早的 urs.tw 計劃, 也寫了一堆文章, 改天再整理一下... 雖然一推出就刻意用彎彎開放出來的 MSN 圖組, 但說保證沒有版權問題也沒把握, 所以還是很低調的在做... 曾經想過自己弄個繪文字或從字帖上來弄, 但後來沒時間所以作罷, 也有請朋友幫忙畫圖或照像...
-
(這篇文章說是寫給政府單位的資訊局處做參考, 但主要是考量到政府單位較難像一般民間機構有很快的轉變, 或有足夠的資源去改變, 但相對若對於一些資訊化還不夠, 或資訊單位較難被重視的大型企業或研究單位也適用) 0. 不能有共用帳號: 網路最重要的是 Trust but (c...
網誌管理員已經移除這則留言。
回覆刪除