2007年10月29日 星期一

這次 PageRank 的改變, Xuite 是最大的贏家!

標題這句話怎模說呢?

在這次地震之前, Page Rank 是 6 的部落格有 15 個, 而算到剛剛, 目前有 13 個部落格的 PR 值是 6 分, 且其中有 7 個部落格是進步到 6, 這句話是說, 原本的 15 個 PR=6 部落格中, 只有 6 個是保持不變的, 這句話代表有 9 個部落格從 6 分摔出去.....

但在這新進的 7 個部落格中, 有 3 個不是 Xuite, 也就是說 Xuite 就占了 4 個, 所以在現在 13 個 PR=6 的部落格中, Xuite 就占了 7 個, 也就是占了半數以上, 但除了 Xuite, 這 6 個中, 有一個是 MSN Live Space, 其他都是獨立架站...

這句話代表著麼呢? 除了 Xuite 外, 其他的 BSP 大都因為架構的關係在 PageRank 吃了大虧嗎? 所以到最後還是獨立架站在這方面比較吃香嗎?

在 PR=5 的部落格中, 有 41 個, 有 20 個是用 BSP, 也就是說獨立架站的占一半 21 個以上, 而使用 BSP 的分佈如下:
iTHome: 7
sina: 4
xuite: 3
wordpress:2
其他都只 1 個, 如無名, blogspot, 自由時報與行政院農業委員...

當然或許還是自主架站是主流, 雖然維護一個部落格平台不是簡單的, 但若肯花工夫, 還是會有回報的...

[後記] 有人問件事代表什麼呢? 也就是說 Xuite 因為 PR 較高, 所以吸引了較多的 Search 搜尋進來的散戶, 只是這個有效性是對 Google Search, 並不見得很明鮮..

網路的真實面

當我寫出前一篇 "一封很棒的信" 時, 說了一句話:
台灣 Alexa 前 100 名中, 有 30 個是國際網站, 另 10 個是學校等等的非營利外, 另外有一半是色情與論壇, 剩下一半的才是知名 ICP, EC 等等網路服務.
也說到事實上要精算才行, 而我大約也算了一下, 大概分佈如下:

名次國際國內暗黑非營利
0~105
4
1
0
10~203
2
5
0
20~301
4
5
0
30~404
4
2
0
40~503
2
5
0
50~60
1
3
6
0
60~70
1
4
5
0
70~80
1
3
5
1
80~90
3
0
6
1
90~100
3
4
3
0
總計
25
30
43
2

所以很明顯的, 我原本是說 30:30:30:10, 結果是 25:30:43:2, 意外的是一些非營利網站慢慢的沒有後, 一些包含 18 禁或有侵權可能的網站占了 43 個, 當然這 43 個有部份也是國際性的網站, 因此可以分一些到前面, 因此扣掉非營利的想法這部份資料還算蠻正確的, ...

因此, 若是取個大數的話, 大概是 25:30:45, 即是 5:6:9 的狀況, 甚至可以減化成 3:3:4 這樣, 一些國內知名網站占所有 100 大網站約 3 成, 而國外網站也占 3 成, 其他 4 成是非知名網站, ...

當然有空可以分析這些 4 成的網站, 大概都是論壇, 貼圖, 下載, 18禁, 同志, 等等, 只是我沒這個心吧, 畢竟再算下去, 很多人會心寒了...

2007年10月27日 星期六

關鍵字週期

當然在之前分析關鍵字中, 最簡單的就是計數的量, 以及目前狀態, 若是稍微認真一點, 就是做個迴歸後算趨勢, 這個是之前有提到的...

但通常說到點閱數與時間序列, 就很難不提到週期性, 因此現在加了一個週期的計算, 算出這個關鍵字的屬性為何? 目前也是分三種:

1. 爆炸度: 基本上就是當有高峰的時候, 與平常之間做比較, 目前是來比較中位數與平均的關係, 事實上也可以考慮把最高值給帶進來..

2. 週期性: 基本上就是計算目前這個關鍵字有幾個高峰, 當然有些高峰不夠高, 或太近就會不算或簡化.

3. 持續度: 就是當有週期性的高峰的時候, 一個高峰可以持續多久.

當然除外還有變異數(標準差)的計算可能性, 以及計算其迴歸的線圖, 甚至在之前之後做一階或兩階的微分(梯度)來看變化與動能, 都是可以看到曲線的狀況.

而上圖則是 隋棠桌布 的線圖, 很明鮮的可以看到五個極大峰, 但因為有做 7 日移動均線的計算, 所以事實上只有三個波峰, 所以最後是 爆炸度: 週期度: 持續度: .

然後我們來看幾個主要名氣人物 (總名氣前五名) 的狀況:

蕭敬騰: 爆炸度: 週期度: 持續度:
林宥嘉: 爆炸度: 週期度: 持續度:
楊宗緯: 爆炸度: 週期度: 持續度:
長瀨茜: 爆炸度: 週期度: 持續度:
玉木宏: 爆炸度: 週期度: 持續度:

很明顯的是雖然這五位名氣都是相當高, 但沒有兩個人的屬性是一樣, 像蕭敬騰是穩定的保持一定名氣, 但楊宗緯是常有爆炸性新聞, 林宥嘉反而是一直有週期在運作, 另外兩位大家可以跟前三位做比較, 從這個圖表一看, 是不是很容易表達出與證明出狀況呢?

當然時間序列的東西, 是一個有持續性的狀況, 永遠會一直在變化, 就像是週期會一直產生, 尤其是許多以為沒有週期的, 可能要拉個一年五年才知道狀況, 目前樣本數才半年多, 此時來討論週期與否也太早...

而有沒有一種除了用一個延伸的線圖來表達時間序列, 只靠一張有限度的圖來表達一個一直延續無限度的資料, 我已經思索到一種有趣的圖型可能性, 到時再做出來給大家看, 這樣以後在預測上面, 會有更有趣的結果, 所以常說, 有時預測不見得是要說出未來, 而是用簡單的方法表達過去, 一眼就可以知道, 這就是 "Data Presentation(資料呈現)" 有趣的地方..

2007年10月20日 星期六

一封很棒的信 (網路的真實面)

先來看一封信, 信的內容是在 quote 中:

許多普通人在網路一個月可以賺三萬到三十萬以上。如果你知道這些成功的網路事業的 S.O.P. (標準作業流程)你也可以做到!只需要一些知識,與網路工具,你也可以為創造為你賺錢的網路事業!

一個半月的輔導課程,讓你從網路新手成為一個網路行銷達人!

恭喜你!!

你會看到這個網頁因為你一定發過數十萬封的垃圾信件,或者你很想知道如何賺錢!你可能擁有一個網站,但是卻沒什麼生意,或者你生意不錯但是想要賺更多錢!


不論如何,我要告訴你一個機會。 這個星期六下午二點 (十月二十號)台中的某個地方有個小聚會,討論台灣鮮少人知道的網路經營祕訣。在那個聚會裡,我會告訴你:


兩個網路成功祕訣,保證...

  • 讓賺錢的網站更賺錢!保證讓你的營業額提升 30% ~ 300%
  • 不懂電腦的人頓悟網路如何賺錢而拍手叫絕!
  • 讓你看到為什麼大部分人的網站都不賺錢,而賺錢的網站都長什麼樣子!
  • 讓你知道網路商業時代裡你該如何準備自己

這場免費的聚會,目前只剩下 8 個名額

我們不建議以下的人來參加:

  • 網頁設計師(因為他們不懂得行銷,我們網路醫生才有工作做)
  • IT 資管人 (因為他們不知道網路的另外一面,系統才請的到人管)
  • PPC 廣告經銷商 (因為他們不知道訣竅,我們才能倍增客戶的營收)

我們歡迎以下的人來參加:

  • 網站企業的經營者,想知道如何提升營業額的人
  • 用網路增加額外收入,想創業的人
  • 薪水不理想,想提升自己競爭力的上班族
  • 英文能夠讀寫,但一個月少於六萬塊薪水的人
  • 有獨特產品想要銷到國外那個十倍大的市場的人

我們會教你什麼?

*告訴你如何用四千塊設立你的網路提款機!

*如何在半個小時內擁有你自己的網站!!

*告訴你如何在最短的時間內創造出最大的流量!!

*告訴你許多網路金礦的位置!!

*訴你如何找出或做出會賺錢的產品!!

*告訴你如何將訪客變成顧客!!

*告訴你最先進最成功的行銷手法與步驟!!

*如何讓你的網路事業全自動化!!

*如何免費讓數千人為你打廣告幫你賣產品!!

"歡迎你前來參加這場免費的聚會!"

報名專線:xxx-xxxx XX小姐

上面是這封信的內容, 雖然我知道寄信者是 "無差別" 寄給我, 不然我在定義中應該是不建議來參加的人, 而這封信為甚麼寫的很棒呢?

1. 限定 8 個名額這個是不錯的, 雖然在一個星期我收到時也是 8 個名額, 但這方法已經在國外的 Spam 到處都有看到.

2. 把歡迎的人設定看起來是特定人士, 但事實上是所有人..

3. 把那些有可能否定的人排除在外, 做了很好的預防針.

4. 信件的內容不是在於寫給收信者, 而是怕收信者去取信第三人, 所以這封信在直銷面談 ABC 中成功的扮演兩個人的角色..

5. 排版的方式雖然很普通, 但能夠段落分明, 是件不容易的事...

當然我承認的確有 SOP 能夠月收入 3萬到 30萬, 但這個是很不容易的, 甚至必須做到很黑心才行, 例如某人跟我的對話的節錄:
我都是用鬧人, 或是裝成用戶, 我有一個Team, 基本上我有一群學生大概17~20吧, 每天都去各個論壇, 裝作是用戶順便放連結, 永遠不會被發現是廣告的, 哈哈, ....., 還可以假裝暨轉寄, 用轉寄隱藏信, 媒體收到就會報導了, 或是假裝成一堆人寄給他, 暴利阿, 有不少大網站都找我弄這種, 我們Team就是專弄炒作的阿...
我也承認這樣才能夠用較少的努力去賺到大錢, 去做網站服務說要賺到錢, 是相當難的, 甚至是說, 越好的服務越難賺到錢...

有一天看到 Billy Pan 寫到網路的黑暗面 (原文叫10大論壇: 看台灣網路活動的地下面), 事實上我都說, 台灣 Alexa 前 100 名中, 有 30 個是國際網站, 另 10 個是學校等等的非營利外, 另外有一半是色情與論壇, 剩下一半的才是知名 ICP, EC 等等網路服務, 當然這個是沒有經過認真統計過的數字, 改天來計算一下...

我常說, 網路是反應現實, 但只是經過扭曲與變型, 只是放大與縮小的是光明面還是黑暗面, 當然最大的問題是怎樣才是光明與黑暗呢? 我想可能是要打過 Shining Soul 系列的人才能知道了...

2007年10月10日 星期三

幾個 Web 2.0 網站 (2) -- Web 2.0 Benchmark

上篇文章討論到黑米, diggirl, 部落格觀察, Funp Findbook, 而這次加了 愛評, buboo, 15fun, ppolis地圖日記, 則圖為:


要看原始的資料可以到 這個 http://myurl.tw/00aR 來看...
但我這篇來說的是 Web 2.0 meter, 就是 Web 2.0 屬性值, 此時我們來看這 10 個網站的分數:


很明顯的這 10 個站都有超過 10 分所謂 Web 2.0 網站的基本要求, 但若是狹義一點的 20 分的話, 可能這 10 個網站只有 6 個超過 20 分, 但相較大家所知道網站如博客來是肯定不到 10 分的, 只是這樣算訂便當與高飛網也可能不見得有 10 分..

這個試算表可以到 http://myurl.tw/00aS 來看..

而計算方式可以參考 "Web 2.0 網站?" 這篇的準則, 當然這準則只是初步而已, 但做為一般的評鑑已經不是太大問題了, 也包含一般的部落格與 wiki, 都是可以輕易的超過 10 分且到 20 分以上, 但本來只靠單一屬性來判斷一個網站是沒意義的, 還是採取縱合指標會好一些..

但我這篇不是要去說高飛網, 訂便當不是 web 2.0 網站, 只能說用這種評斷基礎, 可能會出問題, 而至基礎的 16 點我想應該不太會有人反對吧, 但我承認這樣的加總來判斷是很危險, 甚至若只是弄個三個級數, 更是有問題, 但若是超過 3 個級數的話, 我猜會大亂...

不然我原本所謂的貼紙, 很想寫: "貼紙或 API 的到達度比網站的到達度還高上兩倍", 但這樣可能只有 funp, 部落格觀察, 黑米與 buboo, MyIcon 等工具型網站才能做到, 但的確所謂的貼紙/API的到達率, 往往是評斷 Web 2.0 網站與否的重要指標, 或許那天我經過某江大老的首墾, 把這數字公布出來會更有趣些, 會比這個 Benchmark 評斷基準有意義多了..:)

2007年10月1日 星期一

Data Mining 是跟大量資料在博鬥

關鍵字在這個題目中有是 Data Mining 的一環, 而我在 甚麼不是資料探勘? 甚至否定數量不夠的計算中, 意義是不高的, 甚至也要在一定的時效性完成....

目前部觀門每天讀進 200 萬筆資料, 然後經過分析, 留下 20 萬筆資料, 也就是若一年下來, 依照這比例成長, 明年此時至少是每天 500 萬筆到 1000 萬筆資料, 因此可以說是一年至少 12 億到 22 億筆資料在運作...

此時還不包括之後使用者參與進來還可以增加更多有效資料, 就像是昨天部關門有 6 萬個點閱數以上 , 然後可以再進一步分析的更多, 但說真的, 這樣的資料, 要去計算與儲存都是一個很大的功夫...

且在計算時, 一定要考量到計算到一半狀況, 因為每一次資料的計算都可能是數分鐘到數小時, 因此在某方面要做 Incremental 循序性的計算, 此時要做到每次的計算可以延續之前的計算結果, 且隨時可以計算, 甚至要回溯到歷史的所有資料, 此時就是一個很大的挑戰 ...

甚至這還不是最大的挑戰, 而且要去計算這些, 須要在有限的機器成本下完成, 這個有限, 不要說是幾十萬, 甚至是在不到十萬下完成, 就像是部觀門, 現在機器成本只有 3 萬, 面臨這樣的點閱數與計算, 可以說是絞盡腦汁去完成...

當然這樣也不算是正常的, 畢竟有時錢是最簡單的東西, 做出有用的東西才是最難的, 雖然部觀門到底是對誰有用我不知道, 但對於我自許為喜歡觀察社會, 而做出影響社會的機制與系統, 怎樣也是要做出對自己有用, 也對他人有用的東西...


到目前為只, 這種關鍵字的觀察, 以及這個計劃與想法, 讓我思索與看到很多東西, 甚至通常說, 我是從這系統獲得最多的人, 包含這個部落格的點閱數也是像上圖與下面這樣子:

日期點閱次數文章數
2007-09-3032120
2007-09-2937960
2007-09-2849480
2007-09-2733881
2007-09-261070
2007-09-25670

當寫完長瀨茜後, 從 50~100 的點閱數變成 3000~4000, 好像是在騙點閱數的感覺, 雖然我不否認我在寫之前就知道會有這現像, 但我原本是估計從 50 跳到 500, 結果沒想到比 星光幫 的效應還要強, 因為當時這個站的點閱數最高也只有 1000 多一點....

要看有關 長瀨茜 的文章, 請到 Hsiao Collecition 吧, 畢竟這邊是在討論這件事, 不應該跟她與他搶功...

但有人問我到底如何進到部觀門呢? 請參考這篇 從"絡門"看關鍵字林 , 就有寫個大概, 有時我覺得這個功能 Widget 比部落格排名有意義多了, 畢竟當時也的確是比部落格觀察更早的企劃, 只是當時沒有完成而已...

熱門文章