沒有足夠資訊所做的判斷, 只是又再次增加錯誤的決策罷了....
楊威利, 前十三艦隊軍團長
我們都知道要看一個網站經營, 最直接的就是看使用量或業績/利潤, 但這些只是最後的結果, 要知道如何改善, 還是須要很多細節去發現如何做, 網點就是因為這樣做出來的網站.
在之前很多人知道這網站是從 Data Mining 資料探勘的角度來看 Search Engine Optimization (SEO) 的這個企劃, 但想想我個人實際上跟本不喜歡 SEO 這東西, 而再做一個 SEO 網站不是很好笑嗎? 所以窮則變, 變則通, 最後 SEO 變成 Site Examination Over, 也就是網站完全評點, 簡稱 "網點", 這樣就不會太無趣了吧...
但從 2 月底做到現在, 資料都搜集快三個月了, 很多資料量的確大到可以視覺化了, 其中最重要的就是這網站真正的初衷: "幫網站做成長的歷史".
以我偏頗角度的思維來看, 觀察數字須要做到幾點:
1. 自動化: 能夠不透過人的方式主動, 客觀的抓到資料.
2. 即時性: 隨時盡量呈現最新的資料.
3. 歷史: 從時間軸知道事情的變化.
4. 標準化/指數化: 無論是 Normalization 或 Indexing, 降冪達到一個可以比較的基準.
5. 大量資料: 要有足夠的 Entropy (熵) 才能夠獲得有用的結果.
但上面者五點, 很多人都有做到, 但很多人都會忽略一點, 且也最麻煩的是 "歷史", 畢竟很多人在處理資料的時候, 都沒有考慮到時間序列 (Time Series) 的資料處理方式, 就像是我常以網路管理角度的出發來舉例: "CPU 負荷 80% 不算高, CPU 負荷 5% 不算低, 因為要跟之前做比較".
網點站抓的資料相當大量, 有從關鍵字角度出發, 也有從網站角度出發, 上次有說到從關鍵字在各個社群網站的表現來推估使用者在 SNS 內容產出量的比例, 這就是一種二次資料的應用, 而這次也從 Google/Bing/Yahoo 等搜尋引擎來看網站的表現, 雖然也是種二次資料, 也就是絕對沒有網站真正經營者資料來得更完整, 但我知道大部份的網站經營者都沒考慮 "時間" 與 "比較".
因此網點就以這兩個角度做出發, 幫大家從 Search Engine 的觀點來看自己網站的成長史, 以及跟他人做比較, 只是現在寫出來的是成長史, 比較部份可能要晚一點完成.
下圖就是這個部落格 (黑貘來說) 的成長歷史圖表:
這歷史有兩部份, 一部份是網頁收錄數, 以及最新的外部連結, 這兩部份無論對內容經營者, 或社群行銷者都是很重要的資訊, 雖然這些資料沒有每天的 Log Analysis 準確, 但又的確是可以反應出一種經營成果的 KPI.
當然這系統是開放的, 也就是說大家都可以自己輸入自己查, 但像外部連結收錄史這比較會花資源的, 可能就是以 Coffee Service 的方式來運作, 只是比較討厭的事是像這樣漂亮的圖表, 可能須要輸入後過幾個星期才會比較好看, 也就是當已經抓了上千筆資料後, 在 Presentation/Visualization 呈現與視覺才有足夠的 "空間" 來美化, 相較資料不夠還畫不出甚麼有意義的圖表.
這邊的外部連結是以 Google Crawler 呈現在 Search Engine Result Pages 為主, 若你自己去看 Webmaster Tools 數字一定會比這邊多, 且更有時效性, 但通常這邊的資料往往也是最會直接影響 SERP, 所以相當重要, 因為外部連結是社群行銷經營最有義的成果. 再過幾天, 也會針對這部份做分析, 包含以網站為單位的分析都有可能.
網站經營的層面真的太多, 我之前還寫過網站經營的 13 層面, 比 ISO 的 OSI 七層還要多, 這也表示經營網站要看的資訊真的很多, 只是要如何系統化的去了解, 這個評點只是眾多工具的一個, 但也是蠻重要的一個.
Anyway, 若大家有興去, 就去 網點: 網站完全評點 看看吧..
Anyway, 若大家有興去, 就去 網點: 網站完全評點 看看吧..