基本上, 我認為我在所謂趨勢觀察的水準是不該由前面數的, 尤其是對所謂部落格的了解, 我想我是不該跟別人爭的, 會寫那些文章多是有感而發, 或者是工作須要, 所以, 我還是會照寫, 感謝很多人的鼓勵, 包含 j2h, t4n, c10e, h4s 與其他很多人, 謝謝...
但這邊不是要寫如此肉麻的文章, 請略過...
而是要寫一個寫程式的過程, 就是如何在 3 秒中算出 3000 個部落格的趨勢...
也就是說, 一直說要寫, 但一直沒寫的: "今日點閱數預測", 這個說真的蠻無聊的, 就是基本的外插與內插, 但不一樣的就是到底要參考多少資料才能更準確呢?
在 Sitemeter 中, 有以時, 天, 週, 月的方式來組成一個矩陣, 基本上就是所謂的日均線, 週均線, 與月均線來回推的方法, 但即使是 Shinystat 也是一樣用均線的概念...
而我想寫的就是以每半小時來做七日均線, 然後以兩天內的資料來回推, 複雜度就高很多了, 但真正的挑戰也是要如何在 3 秒算出 3000 個部落格的資料, 其中大概要多存了約 500 筆資料才能算出來, 最後還要看能不能在 1~2 個 I/O 就算出這答案, 所以這個資料庫的規劃與流程還挺累的..
在剛剛大約做個雛型出來了, 雖然大家看到的就是自己 Blog 在基本資料多一個 "今日點閱預測", 但這個是每半小時更新一次, 且準確率算高的, 因為會參考最近部落個點閱狀況, 且以你自己的各自模型去計算, 完全沒有公用的資料與模型...
我當時為甚麼想做, 最主要是想做成一個 Google Tool Bar, 直接拉下來去觀察我設 "我的觀察" 的 Blog, 與其說是要去看名次, 我更想看到的是一些其他資訊, 其中就是目前點閱數, 預計點閱數, 以及一些文章資訊.
而文章資訊大概最近想說去完成, 但這也不是簡單的工程, 我想應該會改寫原本 Ping 文章數的程式, 而像更新排行資料那樣, 一個週期各自去抓, 我想這樣才是較對的, 所以當這個完成後, 許多資訊會慢慢有價值, 一個 Blog 的 Outline 的 Profile 就會漸漸浮現, 那就很有趣的...
但為甚麼要八天後才能公佈呢? 因為現在才開始儲存那 500 筆 Sample, 至少要一個星期後來看是否有漏失, 自動化有時間性的抓取總是困難 Debug, 唯一的方法就是等待時間的到來...
所以現在可能還不夠準, 但等八天後我相信準確度就很夠了 ...
2007年3月7日 星期三
訂閱:
張貼留言 (Atom)
熱門文章
-
昨天在臉書的塗鴉牆朋友分享了一個 王美恩 的" 狀態更新 ": 今天在外面餐廳吃飯,旁邊一桌坐了五六位穿著制服的廚師在吃飯。 老大開講:「我跟你們說,要看警察打人就要看三立,要看學生丟石頭警察受傷就要看中天。」 小廚師問:「大哥,你都不看T...
-
剛剛高藥師反問我一個問題: 如果我不做SEO,網站根本沒有人知道 我又不像你們可以掛在部落格觀察的首頁打知名度 文章寫的再好,你會天天來看醫療的東西嗎??? 這是一個很有趣的命題, 但我想他沒想到 "只是捷運日記" 在有人亂加貼紙之前, 每天點閱數大約是 20...
-
以下的言論, 純以我是以一個工程師出身的網管, 也以做過 ISP 基礎建設的工作經驗來發言. 前一陣子有人提出取消手機網路不應該有吃到飽 (Flat Rate) 的奇想時, 有參與網路發展的人都知道, 這個固定費率的使用量是網路發展的推手, 或者是指標, 甚至是門檻, 若把這...
-
所謂的芝麻信用, 說穿了就像他們自己所說的 : "芝麻信用是依据方方面面的数据而设计的信用体系", 這個系統可以追訴到 2014 年 6 月 14 日中國國務院發佈的 " 社會信用體系建設規劃綱要 (2014-2020) " 開始, 但...
-
到底 PUG 指的是 Plurk User Group 或 Plurk Usage Geek 這兩個我都不太喜歡, 說是 User Group 這種過於大範圍的圈圈是我不適應的, 而 Geek 在我觀點更是談不上 (我只敢說自己是 Player/User), 但說到用 pug ...
-
大家還記得我在兩個月前寫了一篇 " 如何用網頁到網頁的延伸閱讀, 取代網站的交互連結 " 的文章嗎? 裏面談到兩個可能的發展性: 1. 共通 Tag : 這個沒甚麼了不起, Technorati 就是如此, 雖然這是很好的東西, 可惜沒人用了, 只是...
-
今天臉書上有兩個藝人很紅, 一個是說 "My Hometown" 的張懸, 另一個是 "悍衛傳統道德" 的郭采潔, 因為她們的表態, 造成臉書很大的風波... 這兩件事剛好都是 "言論自由" 很好的例子, 一個是...
-
這不是炫耀文, 好吧, 我承認一開始心態可能是, 但我發現噗浪存在一個很有趣的噗浪生命靈數, ... 首先來看上圖, 大家看得出甚麼有趣的數字嗎? 呵呵~~~ 粉絲數/朋友數=2500/200= 12.5 回應數/Plurks=8815/675= 13.1 Plurks/推廣數=...
-
這隻 Pleo 是叫 "顯三", 因為是 "顯二" 養的, 在某日(2月24日)我綁架來玩, 就帶牠去淡水河邊散步, 下面就是牠的寫真集~~~ 只是重點不是在 Pleo 電子恐龍, 這有甚麼好照的阿, 我又不是 3C Freak, 當然是路...
-
這次參與資策會的社群力指標, 在前一篇的講 部落客百傑 的文章已經講個大概, 但我知道很多人看了還是一頭霧水, 其中最主要的一個東西就是 "社群力指標", 雖然這指標明眼的人一看就是我一直在強調的 "Index/指數" 在實用上是很重要的...
結果也算是公佈了...
回覆刪除http://myzilla.blogspot.com/2007/03/blog-post_08.html