2011年3月9日 星期三

Weather DataMining 氣象探勘


在渾沌理論出來之前, 即使已經過了所謂科學終結的時代, 那時社會的氛圍還是在想說只要有足夠的資料, 就可以 "模擬(Simulation)" 出氣候給予預測了, 但是一隻蝴蝶(誤)把這想法給粉碎了, 但不代表說模擬計算不重要, 只是沒那麼 "絕對" 罷了, 因此在我小時候, 台灣最快的電腦不是在國家高速網路中心, 而是在氣象局.

無論是 Simulation 或 Emulation, 我們知道在計算在氣象可用的模型是相當多的, 甚至有很多歷史資訊可以參考, 但套句 Data Mining Forecast 兩大定律: 天底下無新鮮事, 天底下沒有相同的事, 再怎麼計算也只是種猜測與推估, 只是眾多可能性之一, 但到底除了這個之外, 還有沒有其他候選答案, 也就是 Minority Report, 這個可能在現實上要大眾了解是須要再教育的, 只是預測的單位不只一個, 無論是中央氣象局, 中央氣象台, 還有國外許許多多的單位都在做預測.

當然這些都是不同的看法與觀點, 甚至因為適用性不同, 預報方式也有不同的角度, 但到底那個是最準確的呢? 基本上有了 iPad 後, 我就很習慣的多看幾家, 除了 Weather Chanel 外, Accure Weather 也是不錯的參考, 只是最後就實務上檢驗那個是最準的呢? 看樣子並沒有這樣的資訊, 因此我就想若是氣象預測的準確率是可以成為 KPI 的話, 到底誰能夠拔得頭幬呢?

事實上說要知道誰最準 , 就實際面應該是我們也是想要從中知道最準的答案吧, 甚至若是不準的話, 會往那邊偏差呢? 若心裏有個底的話, 也是相當不錯吧, 因此這個 Weather DataMining 的小計劃就慢慢在腦子形成了.

在還沒有公布答案之前, 事實上所有單位都會對某天做很多次的預測, 從兩週前, 到一週內, 到三天內或是在明天, 每次的預測都不盡相同, 當然我們知道時間距離越遠, 變因越多, 誤差會更高, 但若能夠掌握好的模型與變因, 理論上很快就可以在幾天前就收斂, 但實務上是即使說要預測 2 小時後的天氣都很困難了, 更何況是在兩天前, 我想除了 Nami 娜美外應該沒有多少人有這能力.

有了準確率的 KPI, 更可以用收斂穩定度做另一種輔助參考, 理論上預測穩定度跟準確率有相對的關係, 因為若是用最 "真確" 的方法去預測, 穩定度是 100%, 當然準確率也是 100%, 但這是不太可能的, 因此在沒有準確率公布答案之前, 是否可以用穩定度來做考前猜題, 倒也不失個好方法.

這計劃最主要是要滿足我對數字與預測的惡趣味外, 也希望用這個小計劃好好的自己踢一下, 不然我之前所提的計劃都太大了, 當然也真的做出自己以及大家想用的東西, 有意義的東西, 放在 ipad 用自己希望的 UI 來看, 而最後也是要慢慢朝向我莫拉克後, 想說對台灣氣象有些幫助的自我期許.

有誰還有對這計劃有興趣嗎? 來找我報名吧!

2 則留言:

熱門文章