基本上, 我認為我在所謂趨勢觀察的水準是不該由前面數的, 尤其是對所謂部落格的了解, 我想我是不該跟別人爭的, 會寫那些文章多是有感而發, 或者是工作須要, 所以, 我還是會照寫, 感謝很多人的鼓勵, 包含 j2h, t4n, c10e, h4s 與其他很多人, 謝謝...
但這邊不是要寫如此肉麻的文章, 請略過...
而是要寫一個寫程式的過程, 就是如何在 3 秒中算出 3000 個部落格的趨勢...
也就是說, 一直說要寫, 但一直沒寫的: "今日點閱數預測", 這個說真的蠻無聊的, 就是基本的外插與內插, 但不一樣的就是到底要參考多少資料才能更準確呢?
在 Sitemeter 中, 有以時, 天, 週, 月的方式來組成一個矩陣, 基本上就是所謂的日均線, 週均線, 與月均線來回推的方法, 但即使是 Shinystat 也是一樣用均線的概念...
而我想寫的就是以每半小時來做七日均線, 然後以兩天內的資料來回推, 複雜度就高很多了, 但真正的挑戰也是要如何在 3 秒算出 3000 個部落格的資料, 其中大概要多存了約 500 筆資料才能算出來, 最後還要看能不能在 1~2 個 I/O 就算出這答案, 所以這個資料庫的規劃與流程還挺累的..
在剛剛大約做個雛型出來了, 雖然大家看到的就是自己 Blog 在基本資料多一個 "今日點閱預測", 但這個是每半小時更新一次, 且準確率算高的, 因為會參考最近部落個點閱狀況, 且以你自己的各自模型去計算, 完全沒有公用的資料與模型...
我當時為甚麼想做, 最主要是想做成一個 Google Tool Bar, 直接拉下來去觀察我設 "我的觀察" 的 Blog, 與其說是要去看名次, 我更想看到的是一些其他資訊, 其中就是目前點閱數, 預計點閱數, 以及一些文章資訊.
而文章資訊大概最近想說去完成, 但這也不是簡單的工程, 我想應該會改寫原本 Ping 文章數的程式, 而像更新排行資料那樣, 一個週期各自去抓, 我想這樣才是較對的, 所以當這個完成後, 許多資訊會慢慢有價值, 一個 Blog 的 Outline 的 Profile 就會漸漸浮現, 那就很有趣的...
但為甚麼要八天後才能公佈呢? 因為現在才開始儲存那 500 筆 Sample, 至少要一個星期後來看是否有漏失, 自動化有時間性的抓取總是困難 Debug, 唯一的方法就是等待時間的到來...
所以現在可能還不夠準, 但等八天後我相信準確度就很夠了 ...
2007年3月7日 星期三
訂閱:
張貼留言 (Atom)
熱門文章
-
昨天在臉書的塗鴉牆朋友分享了一個 王美恩 的" 狀態更新 ": 今天在外面餐廳吃飯,旁邊一桌坐了五六位穿著制服的廚師在吃飯。 老大開講:「我跟你們說,要看警察打人就要看三立,要看學生丟石頭警察受傷就要看中天。」 小廚師問:「大哥,你都不看T...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
在開始寫這篇之前, 先弄個小 box 讓大家回顧之前有關 網站完全評點 (原SEO鑑價系統) 的文章: 對黑帽 SEO 的回應 (SEO 鑑價系統的初探 I) 內容關鍵字的數量與比例 (SEO 鑑價系統的初探 II) 你找的 SEO 公司真的有成效嗎? (SEO 鑑價...
-
在我寫出前言後, 當天晚上就把當時所說的數字的計算中兩個未寫入的就直接加進去後, 演算法就算是定型了, 然後就是未來的幾個部份: 1. 歷史: 當然每一週的變化是要可以記錄, 但是 "追加" 的部份怎記就是一個大問題. 2. Widget: 本來這系統正式要出...
-
依 IMDB 超過 1 萬人以上評分的順序 降世神通 1. 9.3 Avatar 降世神通 2. 9.2 Ricky and Moorty 3. 9.1 鋼之鍊金術師 Brotherhood 4. 9.0 進擊的巨人 5. 9.0 獵人 6. 9.0 死亡筆記本 11. 8.8 ...
-
民進黨為了要決定提名,因此辦了民意調查,來決定候選人,而公布高雄市的民調時,嘗試跟 "專頁儀表板" 做了個比較,發現相關性達到 0.99 以上這個令人吃驚的事,但第二天台南的民調跟專頁儀表板的相關性只有 0.03,這數字可以說是完全無關,而 0.99 的相關性...
-
當我們做出一個系統, 最希望知道的是有沒有檢定判讀的能力, 不然價值與意義就會少很多, 而在做未來國會的時候, 很多人問我, 網路聲量是否能夠轉化成得票數? 事實上我也是很好奇.... 首先一開始, 就直接算出得票數與網路聲量的相關性 (相關係數), 得出來的答案是: ...
-
這次莫拉克風災不得不否認的是政府處理真的有暇疵, 但我也不得不幫政府說句話, 因為若不是網路的關係, 事實上很多事都不會被發現, 更不會放大檢驗, 只能說運氣太差了.. 讓我想到三個月遇到某個公務人員長官, 他在會議提出一個嚴正的抗議與意見: "你們發展技術的人是如此的...
-
專頁儀表板除了作為社群編輯的工具外,更想做的是想要成為 "透過社群來了解社會" 的儀表板,因此對於 "屬性" 上做了各個面相的定義,除了常見的分類外,更重要的是依立場,議題來去 "標籤"。 因此會有 "...
-
我是不做 "Me,too" 的, 但我知道粉絲團經營最重要的共同指標, 一個是觸及數, 另一個是互動數, 但這數字只有經營者知道, 即使從洞察報告可以看到你加觀察的幾個粉絲團, 最近文章的互動狀況, 但還是離真的狀況有點距離, 除外粉絲團可以比較的就是 ...
結果也算是公佈了...
回覆刪除http://myzilla.blogspot.com/2007/03/blog-post_08.html