基本上, 我認為我在所謂趨勢觀察的水準是不該由前面數的, 尤其是對所謂部落格的了解, 我想我是不該跟別人爭的, 會寫那些文章多是有感而發, 或者是工作須要, 所以, 我還是會照寫, 感謝很多人的鼓勵, 包含 j2h, t4n, c10e, h4s 與其他很多人, 謝謝...
但這邊不是要寫如此肉麻的文章, 請略過...
而是要寫一個寫程式的過程, 就是如何在 3 秒中算出 3000 個部落格的趨勢...
也就是說, 一直說要寫, 但一直沒寫的: "今日點閱數預測", 這個說真的蠻無聊的, 就是基本的外插與內插, 但不一樣的就是到底要參考多少資料才能更準確呢?
在 Sitemeter 中, 有以時, 天, 週, 月的方式來組成一個矩陣, 基本上就是所謂的日均線, 週均線, 與月均線來回推的方法, 但即使是 Shinystat 也是一樣用均線的概念...
而我想寫的就是以每半小時來做七日均線, 然後以兩天內的資料來回推, 複雜度就高很多了, 但真正的挑戰也是要如何在 3 秒算出 3000 個部落格的資料, 其中大概要多存了約 500 筆資料才能算出來, 最後還要看能不能在 1~2 個 I/O 就算出這答案, 所以這個資料庫的規劃與流程還挺累的..
在剛剛大約做個雛型出來了, 雖然大家看到的就是自己 Blog 在基本資料多一個 "今日點閱預測", 但這個是每半小時更新一次, 且準確率算高的, 因為會參考最近部落個點閱狀況, 且以你自己的各自模型去計算, 完全沒有公用的資料與模型...
我當時為甚麼想做, 最主要是想做成一個 Google Tool Bar, 直接拉下來去觀察我設 "我的觀察" 的 Blog, 與其說是要去看名次, 我更想看到的是一些其他資訊, 其中就是目前點閱數, 預計點閱數, 以及一些文章資訊.
而文章資訊大概最近想說去完成, 但這也不是簡單的工程, 我想應該會改寫原本 Ping 文章數的程式, 而像更新排行資料那樣, 一個週期各自去抓, 我想這樣才是較對的, 所以當這個完成後, 許多資訊會慢慢有價值, 一個 Blog 的 Outline 的 Profile 就會漸漸浮現, 那就很有趣的...
但為甚麼要八天後才能公佈呢? 因為現在才開始儲存那 500 筆 Sample, 至少要一個星期後來看是否有漏失, 自動化有時間性的抓取總是困難 Debug, 唯一的方法就是等待時間的到來...
所以現在可能還不夠準, 但等八天後我相信準確度就很夠了 ...
2007年3月7日 星期三
訂閱:
張貼留言 (Atom)
熱門文章
-
昨天在臉書的塗鴉牆朋友分享了一個 王美恩 的" 狀態更新 ": 今天在外面餐廳吃飯,旁邊一桌坐了五六位穿著制服的廚師在吃飯。 老大開講:「我跟你們說,要看警察打人就要看三立,要看學生丟石頭警察受傷就要看中天。」 小廚師問:「大哥,你都不看T...
-
當我們做出一個系統, 最希望知道的是有沒有檢定判讀的能力, 不然價值與意義就會少很多, 而在做未來國會的時候, 很多人問我, 網路聲量是否能夠轉化成得票數? 事實上我也是很好奇.... 首先一開始, 就直接算出得票數與網路聲量的相關性 (相關係數), 得出來的答案是: ...
-
我是不做 "Me,too" 的, 但我知道粉絲團經營最重要的共同指標, 一個是觸及數, 另一個是互動數, 但這數字只有經營者知道, 即使從洞察報告可以看到你加觀察的幾個粉絲團, 最近文章的互動狀況, 但還是離真的狀況有點距離, 除外粉絲團可以比較的就是 ...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
有時我總對自己做的東西沒甚麼信心, 從 Plurk.tw 一直到做了很多延伸的應用, 尤其自己知道美工排版不行, 所以常找人合作, 其中一個東西就是 "噗熱浪"... 事實上 Plurk.tw 比 Plurktop 還早做, 當然我們這邊只能從發文說開始運作開...
-
以下的言論, 純以我是以一個工程師出身的網管, 也以做過 ISP 基礎建設的工作經驗來發言. 前一陣子有人提出取消手機網路不應該有吃到飽 (Flat Rate) 的奇想時, 有參與網路發展的人都知道, 這個固定費率的使用量是網路發展的推手, 或者是指標, 甚至是門檻, 若把這...
-
剛剛高藥師反問我一個問題: 如果我不做SEO,網站根本沒有人知道 我又不像你們可以掛在部落格觀察的首頁打知名度 文章寫的再好,你會天天來看醫療的東西嗎??? 這是一個很有趣的命題, 但我想他沒想到 "只是捷運日記" 在有人亂加貼紙之前, 每天點閱數大約是 20...
-
所謂的芝麻信用, 說穿了就像他們自己所說的 : "芝麻信用是依据方方面面的数据而设计的信用体系", 這個系統可以追訴到 2014 年 6 月 14 日中國國務院發佈的 " 社會信用體系建設規劃綱要 (2014-2020) " 開始, 但...
-
雖然台灣的資訊科技網站或部落格真的很多, 但仔細看, 不少都是 "全文翻譯" 國外的網站, 不加任何自己的想法, 不然就是為了寫而寫, 此時來看, 不要說是獨立思考的創見已經看不到, 連獨立寫作的內容已經消失了. 這篇文章我早在去年 11 月時就想寫了, ...
-
在兩三年前, 跟 "史公" 聊到一個有趣的問題, 就是他感嘆台灣教育在結構上有很大的問題, 大部份的大學教育, 其課程都想教人成為頂尖的人物, 例如 "李安", 且很多學生也都的確以這為目標, 但我們都知道, 李安在沒當導演之前, 也當過好...
結果也算是公佈了...
回覆刪除http://myzilla.blogspot.com/2007/03/blog-post_08.html