基本上, 我認為我在所謂趨勢觀察的水準是不該由前面數的, 尤其是對所謂部落格的了解, 我想我是不該跟別人爭的, 會寫那些文章多是有感而發, 或者是工作須要, 所以, 我還是會照寫, 感謝很多人的鼓勵, 包含 j2h, t4n, c10e, h4s 與其他很多人, 謝謝...
但這邊不是要寫如此肉麻的文章, 請略過...
而是要寫一個寫程式的過程, 就是如何在 3 秒中算出 3000 個部落格的趨勢...
也就是說, 一直說要寫, 但一直沒寫的: "今日點閱數預測", 這個說真的蠻無聊的, 就是基本的外插與內插, 但不一樣的就是到底要參考多少資料才能更準確呢?
在 Sitemeter 中, 有以時, 天, 週, 月的方式來組成一個矩陣, 基本上就是所謂的日均線, 週均線, 與月均線來回推的方法, 但即使是 Shinystat 也是一樣用均線的概念...
而我想寫的就是以每半小時來做七日均線, 然後以兩天內的資料來回推, 複雜度就高很多了, 但真正的挑戰也是要如何在 3 秒算出 3000 個部落格的資料, 其中大概要多存了約 500 筆資料才能算出來, 最後還要看能不能在 1~2 個 I/O 就算出這答案, 所以這個資料庫的規劃與流程還挺累的..
在剛剛大約做個雛型出來了, 雖然大家看到的就是自己 Blog 在基本資料多一個 "今日點閱預測", 但這個是每半小時更新一次, 且準確率算高的, 因為會參考最近部落個點閱狀況, 且以你自己的各自模型去計算, 完全沒有公用的資料與模型...
我當時為甚麼想做, 最主要是想做成一個 Google Tool Bar, 直接拉下來去觀察我設 "我的觀察" 的 Blog, 與其說是要去看名次, 我更想看到的是一些其他資訊, 其中就是目前點閱數, 預計點閱數, 以及一些文章資訊.
而文章資訊大概最近想說去完成, 但這也不是簡單的工程, 我想應該會改寫原本 Ping 文章數的程式, 而像更新排行資料那樣, 一個週期各自去抓, 我想這樣才是較對的, 所以當這個完成後, 許多資訊會慢慢有價值, 一個 Blog 的 Outline 的 Profile 就會漸漸浮現, 那就很有趣的...
但為甚麼要八天後才能公佈呢? 因為現在才開始儲存那 500 筆 Sample, 至少要一個星期後來看是否有漏失, 自動化有時間性的抓取總是困難 Debug, 唯一的方法就是等待時間的到來...
所以現在可能還不夠準, 但等八天後我相信準確度就很夠了 ...
2007年3月7日 星期三
訂閱:
張貼留言 (Atom)
熱門文章
-
說真的, 這次的低潮還算挺久的, 在某方面而言, 在做完 "宅度計" 之後, 就停下來了, 就最後的日期大概是 5/29 號前後吧, ... 這段時間唯一做的大概是 Google Trends 的數字計算, 那時是 6 月 23 日吧, 在之前的 6 月 5 ...
-
很多人知道我累了一陣, 也知道有部份的時間事實上是拿來打 Civilization IV, 但真的心思有點失焦是真的, 而在因緣際會的情型下, 到墾丁去散散心, ... 距離上次去墾丁大概是 1985 彗星來的那一年, 我舅舅開著車連夜到墾丁, 事實上到底有沒有看到哈雷, 我是不...
-
在 Search Rank (SEO) 納入 Users Signal (使用者訊號) 之後, Click Through Rate (CTR) 變成了一個不在只是 UI/UX 的最愛, 更是 SEOers 不得不提的事了. 當然 CTR 不是只有注重 SEO 的人才須要注意...
-
這個標題原文並不是 SEO, 而是米塞斯 (Ludwig von Mises) 說的一句話: "若一個經濟學家只是一個經濟學家, 他肯定不是一個好的經濟學家", 而這個迷思 (Myth) 事實上可以套用在很多地方, 不只是經濟學家, 更不只是 SEO, ...
-
這一篇是寫給要來我家的朋友... 到我新家來借宿有幾種方式, 一個是搭船.... 1. 主要是搭任何一艘船, 能夠在 淡水碼頭 上岸的話: 就可以用走的走到我家... 上圖的 A 與 B 是相反的.. 雖然上面是寫 13 分鐘, 但事實上有 10 分鐘都是在漁人碼頭晃, 走出來不...
-
部落格改網址是最好不要的事, 尤其是對 SEO, 但畢竟我這個部落格本來就不是那種很多人會上來看的那種, 所以在某方面是不用太擔心這件事, 畢竟這個部落格的初衷是: "避免一件事講很多次, 所以寫成文章再叫朋友來看" 但對於 blogspot 這次...
-
只要是有文化, 只要是有歷史, 只要是有種族, 無論是人類 (或是魚人) 都很難擺脫歧視與被歧視的經驗, 而這經驗, 往往會根深蒂固, 很難改變, 甚至是不可能改變, 畢竟這些岐視的劃分與刻版印像都是從成長經驗所造成的, 因為所學, 所思, 所想, 所行為的都是如此, 要一個...
-
在過了短暫的墾丁之旅後, 該收心認真工作, 但似乎也只有一個星期... 這段期間因為 Engadget 的大總編 借我 3G Card, 所以在找吃的或住的是有派上用場, 也幾乎是隨時都可以上網, 但卻沒有停下腳步寫任何的 Blog... 但這次很意外的像這樣的 3G 在墾丁所...
-
在部觀門這計劃一開始的時候, 我就發現 New Order 的 Bizarre Love Triangle 這首歌似乎一直被有人查詢, 其中會導到一個朋友的 Blog, 我在想除了這首歌外, 還有那一首能夠如此成為經典呢? 事實上大家知道的絕不是 New Order 的版本, ...
-
先出場的是每天個人 Plurk 的資料如下範例 其中 username 為 plurk 的個人網址, border 則為 table 的邊, simple=1 則只會出現 plurks 數與 responses 數, 而 period=1 則會出現上次 plurk 與 respo...
結果也算是公佈了...
回覆刪除http://myzilla.blogspot.com/2007/03/blog-post_08.html