上一篇講到我們國家的中央氣象局的預測準確率, 本來以為不會多好, 後來發現事實上還不會太糟, 甚至可以說是在 A 段班的, 而我一直沒寫下雨的準確率時, 認為這個應該大家都有 8 成到 9 成的準確率, 結果我錯了, 事實上有 6 成到 7 成的準確率而已.
這次的計算因為有點小麻煩, 因為有若是要計算溫度的話, 最簡單的就是用每日的最高跟最低溫做比較, 但每天降雨機率的預測本身就是一個在變動的數字, 每次預測都不太一樣, 但這個並沒有最高最低, 只有全有與全無 (有下雨與沒有下雨), 所以到底要如何去做 KPI 的準確率就讓我想了許久.
最後還是把每次的機率給平均起來, 做為當日的預測, 唯一的問題就是每一個單位預測的方式都不太一樣, 所以要先 Normalization, 而接下的計算就跟溫度的預測差不多了.
說起來溫度的預測是有很多解空間 (可能是 40*40) 的狀況, 但下雨與否的解空間好像只有 2, 也就是有跟沒有下雨, 因此預測起來應該很簡單才對, 且大家都說有下雨預測本來就應該有 8 成以上的準確率來看, 說起來感覺也沒那麼困難, 我本來也不太想把這個差別不大的預測當 KPI, 但現在算一遍後, 發現我錯了, 因為大家多數是在公布下雨機率的情形下, 解空間暴增為 100, 這預測變得沒那麼簡單了.
天氣穩定的話, 說要達到預測率 100% 是不難的 (畢竟解空間只有 2), 且控制在 8 成也是沒問題的, 但天氣一不穩定, 只要超過 3 天以前要預測有沒有下雨似乎比想像中的還要難, 事實上八成準確率指的是昨天預測明天, 但這個 KPI 若是延長到五到十天, 當然困難到就更高了, 下表就是現在檢驗的結果 Snapshot 快照:
而這張圖是取自今天 (7/15) 的 http://weather.datamining.tw/kpirain.php , 並不意外第一名可以是在 8 成以上, 但有時第一名卻不到 6 成, 當然平均起來至少有 5 成以上, 但也常常超過 5 成的誤差, 這代表這預測比猴子還糟糕.
只是目前來看, 我們國家的中央氣象局表現的比溫度的預測還要糟糕, 雖然有 6 成 5 的準確率, 但是排名第三名, 比 Weatherbug 以及對岸來得差, 這可能就有點須要檢討了.
而在完成下雨預測的 KPI 後, 加上溫度的 KPI 就完成檢核點的計算, 而進一步是能不能就這些預測做不同的 View, 也就是說我們可以不做天氣的預測, 畢竟這是專業的, 但我們可以利用資料探勘來計算誰的預測比較準, 這代表的是有沒有可能有更高的準確率呢? 請大家拭目以待吧.
2011年7月15日 星期五
訂閱:
張貼留言 (Atom)
熱門文章
-
原本以為這程式是相當難寫的, 但在 AM 4:00 洗澡的時候, 仔細想想並不困難, 但應該說不困難的是在抓取, 但要顯示出有價值與意義的排行榜是相對困難的.... 後來花了不到半小時就有個雛型, 接下來就是顯示這排行榜, 而在昨天睡前 (AM 5:00) 時, 只是一個最近抓到...
-
現在是 3:42 分, 該睡了, 但一直想寫篇文章但都一直提不起勁, 大概是為了準備星期四博客來的會議, 讓整個心態與作息全部亂了, 在此時蛋捲個人站又掛了, 讓我的情續大概到了蠻低的低潮吧... 整個星期六日沒甚麼精神做事, 事實上大約在上星期二似乎就隨著部落格溫度計進到低點,...
-
這個計劃最出是我交大管科系學長所發生的問題, 因為我寫了一篇文章後, 就跑去 Plurk 跟大家討論, 而他是屬於會使用網路但不會使用 Plurk 的人, 所以跟本不知道 Plurk 講了甚麼, 最後我只好把網址給他, 他才晃然大悟這兩個部份的落差, 所以跟我抱怨這件事, 因此我...
-
基本上我是屬於逃避加無所謂鄉愿型的人, 所以即使罵我我也很難生氣, 但還是會難過, 只是比較不會生氣... 所以這次會把回應關起來, 當然不是有誰在說我壞話, 因為這很常見也很習慣, 但最近真的 Spam 廣告訊息真的太多了, 所以先將回應暫時設成 "審核制"...
-
今天臉書上有兩個藝人很紅, 一個是說 "My Hometown" 的張懸, 另一個是 "悍衛傳統道德" 的郭采潔, 因為她們的表態, 造成臉書很大的風波... 這兩件事剛好都是 "言論自由" 很好的例子, 一個是...
-
從分家到現在, 我還是維持著兩個都有在更新的狀態, ... 也因為身份的關係, 也沒去說那家比較好... 但當天空吃下蕃薯藤後, 有好有壞, 但大多是壞處.. 1. 自由欄位最多 10 個, 事實上蠻不夠用的... 2. 輸入資料無法全選, 必須去動滑鼠去選擇... 3. 引用似...
-
這幾個月一直看各個媒體在臉書的表現, 可以發現各個媒體的使用者介面與政策, 都會影響新聞在臉書的行為, 雖然有時是讀者的屬性做決定. 而一則新聞有時不用從內容, 甚至不用人去 "刻意投票", 我們就可以從臉書使用者的 "讚享評" 就...
-
剛很無聊的把噗浪的關鍵字趨勢圖畫出來, 大家有空可以去看看... 這是以話題的 "使用者比例" 為單位, 來跟自己比較, 若是去看原圖有週曲線, 月曲線以及最近一季的狀況: 但下面的圖當時是畫 4 個月 (因為當時也是這系統開始運作的時候), 以後會改半年. ...
-
很多人說 Google 會跳舞, 但事實上是真的嗎? 我們從部落格觀察來看 " 不只是捷運日記 " 的數字吧.. 日期 Google Page Google and Yahoo Link 目前 242 / 576 723 / 83440 ...
-
沒有足夠資訊所做的判斷, 只是又再次增加錯誤的決策罷了.... 楊威利, 前十三艦隊軍團長 我們都知道要看一個網站經營, 最直接的就是看使用量或業績/利潤, 但這些只是最後的結果, 要知道如何改善, 還是須要很多細節去發現如何做, 網點就是因為這樣做出來的網...
沒有留言:
張貼留言