2007年10月27日 星期六

關鍵字週期

當然在之前分析關鍵字中, 最簡單的就是計數的量, 以及目前狀態, 若是稍微認真一點, 就是做個迴歸後算趨勢, 這個是之前有提到的...

但通常說到點閱數與時間序列, 就很難不提到週期性, 因此現在加了一個週期的計算, 算出這個關鍵字的屬性為何? 目前也是分三種:

1. 爆炸度: 基本上就是當有高峰的時候, 與平常之間做比較, 目前是來比較中位數與平均的關係, 事實上也可以考慮把最高值給帶進來..

2. 週期性: 基本上就是計算目前這個關鍵字有幾個高峰, 當然有些高峰不夠高, 或太近就會不算或簡化.

3. 持續度: 就是當有週期性的高峰的時候, 一個高峰可以持續多久.

當然除外還有變異數(標準差)的計算可能性, 以及計算其迴歸的線圖, 甚至在之前之後做一階或兩階的微分(梯度)來看變化與動能, 都是可以看到曲線的狀況.

而上圖則是 隋棠桌布 的線圖, 很明鮮的可以看到五個極大峰, 但因為有做 7 日移動均線的計算, 所以事實上只有三個波峰, 所以最後是 爆炸度: 週期度: 持續度: .

然後我們來看幾個主要名氣人物 (總名氣前五名) 的狀況:

蕭敬騰: 爆炸度: 週期度: 持續度:
林宥嘉: 爆炸度: 週期度: 持續度:
楊宗緯: 爆炸度: 週期度: 持續度:
長瀨茜: 爆炸度: 週期度: 持續度:
玉木宏: 爆炸度: 週期度: 持續度:

很明顯的是雖然這五位名氣都是相當高, 但沒有兩個人的屬性是一樣, 像蕭敬騰是穩定的保持一定名氣, 但楊宗緯是常有爆炸性新聞, 林宥嘉反而是一直有週期在運作, 另外兩位大家可以跟前三位做比較, 從這個圖表一看, 是不是很容易表達出與證明出狀況呢?

當然時間序列的東西, 是一個有持續性的狀況, 永遠會一直在變化, 就像是週期會一直產生, 尤其是許多以為沒有週期的, 可能要拉個一年五年才知道狀況, 目前樣本數才半年多, 此時來討論週期與否也太早...

而有沒有一種除了用一個延伸的線圖來表達時間序列, 只靠一張有限度的圖來表達一個一直延續無限度的資料, 我已經思索到一種有趣的圖型可能性, 到時再做出來給大家看, 這樣以後在預測上面, 會有更有趣的結果, 所以常說, 有時預測不見得是要說出未來, 而是用簡單的方法表達過去, 一眼就可以知道, 這就是 "Data Presentation(資料呈現)" 有趣的地方..

沒有留言:

張貼留言

熱門文章