承上一篇的 Nokia 900: The Plan , 這計劃就網路技術面, 就程式技術面是一點都不困難, 最困難的反而是數學模型, 單單就取樣的部份我就想了很久.
從這 Accelerometers 來看, 會取出三個數字, 這三個數字本質雖然是 -1000 到 1000, 但就自由度的觀點來看, 真正表現的應該可以從這個三維空間轉換成二維的球面座標, 也就是大家常見到的 0~360, 及 -90~90 的座標系統, 只是雖然可以很輕易的以地心引力去定義平面(切平面/軸心), 但最大的問題是 0 度的定義是很麻煩的.
但實務上雖然這個球面座標轉換是可以降冪, 但事實上就盡量想出一個不損耗電力的最低計算是不划算的, 保持這個三維座標體系並不是不可以, 而當時想的 9 個數值應該是:
1. 這段時間移動的總距離
2. 這段時間的向量變化
3. 這段時間的最常見的方向
當然單單定義這段時間, 跟取樣頻率就是傷腦筋了, 一開始實作可能會用 5 秒或 15 秒來作取樣, 這個可以解決前兩點, 但最直覺的第三組數字卻是最難的部份, 因為如前面所說的, 就實務上這演算法早就存在, 是一個很單純的 Clustering 分群就可以做到的事, 但這個演算法在 Data Mining 已經是不能存在的, 更何況在手機上跑.
假設我們以 15 分鐘做一個現在的最常見方向, 就會有 60 組數字, 而每組數字有 3 個, 若是算距離的話就代表是三倍的時間, 接下來若是一個標準的 Clustering, 大概每次要計算 60!*3 次, 這數字之大可想而之, 若還不包含比較及找出新重心的計算.
而若這是一維的數字, 要找出最接近的一組數字已經很困難了, 更何況這是三維的三個數字, 當然理論上也可以嘗試著降冪, 例如把 -1000~1000 變成 -20~20, 一口氣把可能性縮小 125 倍, 然後用數值方法來去 Approach 一個 Feasible Solution, 而不是最佳解.
0. 計算 N 點的初始的解空間 (三維的最高與最低)
1. 計算平均
2. 排除距離平均最遠的點
3. 計算目前的解空間
4. 看看在剩下的 n 中, 其解空間是否是只剩 (n/N)^3 或是直接少於 1/9 (一個定數) => 其平均就是解
5. 回到 1
當然這個計算有很多相乘, 平方與開立方根的比較, 而若只是比較的話 (計算最遠的點) 直接就不用開方了, a^3>b^3 => a>b, 這樣就可以把 60! 的計算變成 60 次的計算, 因為這樣就不用計算目前所有點的相互距離, 直接用平均求點.
這個有一個很糟糕的假設:
一群距離最接近的數值, 會影響平均很大, 若能慢慢扣掉偏離的點, 就會逐漸逼近這一群最接近的數值的集合.
而這個的假設應該極有可能證偽, 但應該是可以相信適用在 95% 的解空間 (尤其是常態分佈後), 但確可以節省 99% 以上的計算.
[編按] 在找到一個合適的圖中, 無意翻到這個資源 (Data Clustering and Pattern Recognition (資料分群與樣式辨認)), 對 Clustering 有不錯的介紹, 只是我上面提的這個解法是用來找到最大群(最常見的姿勢), 而不是單純的分群.
但這篇跟 N900 有甚麼關係阿? 呵呵, 我也不知道, 但至少就演算法面要先想出手機中最麻煩的耗電問題吧.
訂閱:
張貼留言 (Atom)
熱門文章
-
以下的言論, 純以我是以一個工程師出身的網管, 也以做過 ISP 基礎建設的工作經驗來發言. 前一陣子有人提出取消手機網路不應該有吃到飽 (Flat Rate) 的奇想時, 有參與網路發展的人都知道, 這個固定費率的使用量是網路發展的推手, 或者是指標, 甚至是門檻, 若把這...
-
大家還記得我在兩個月前寫了一篇 " 如何用網頁到網頁的延伸閱讀, 取代網站的交互連結 " 的文章嗎? 裏面談到兩個可能的發展性: 1. 共通 Tag : 這個沒甚麼了不起, Technorati 就是如此, 雖然這是很好的東西, 可惜沒人用了, 只是...
-
部落格改網址是最好不要的事, 尤其是對 SEO, 但畢竟我這個部落格本來就不是那種很多人會上來看的那種, 所以在某方面是不用太擔心這件事, 畢竟這個部落格的初衷是: "避免一件事講很多次, 所以寫成文章再叫朋友來看" 但對於 blogspot 這次...
-
這個交大機車的故事不是在講交大很機車, 而是交大為甚麼能夠騎機車的故事... 甚麼? 很多人認為交大校園有一個條機車外環道是天經地義的事? 事實上不然, 這是經過許多抗爭得來的, 因為上一篇哈巴狗事件有很多回響, 所以我這篇來繼續講古. 機車在交大可以說是個文化, 尤其以前竹東算...
-
這一篇是寫給要來我家的朋友... 到我新家來借宿有幾種方式, 一個是搭船.... 1. 主要是搭任何一艘船, 能夠在 淡水碼頭 上岸的話: 就可以用走的走到我家... 上圖的 A 與 B 是相反的.. 雖然上面是寫 13 分鐘, 但事實上有 10 分鐘都是在漁人碼頭晃, 走出來不...
-
又一個是乍看很漂亮, 功能很多, 資料也不少, 但完全沒有經營概念與基礎的網站, 為甚麼政府單位的網站都是這樣阿.... 基本上要討論裏面內容的問題可能討論不完, 我先說以內容與經營相關 SEO 的角度來看這網站的問題: [主要問題] description: ...
-
先出場的是每天個人 Plurk 的資料如下範例 其中 username 為 plurk 的個人網址, border 則為 table 的邊, simple=1 則只會出現 plurks 數與 responses 數, 而 period=1 則會出現上次 plurk 與 respo...
-
很多人知道我累了一陣, 也知道有部份的時間事實上是拿來打 Civilization IV, 但真的心思有點失焦是真的, 而在因緣際會的情型下, 到墾丁去散散心, ... 距離上次去墾丁大概是 1985 彗星來的那一年, 我舅舅開著車連夜到墾丁, 事實上到底有沒有看到哈雷, 我是不...
-
基本上我上一篇的 " 我為甚麼要 Plurk ? " 講出來了用 Plurk 的人並不是很多人都有在經營部落格, 所以前一篇的 " Plurk 的個人 Widget 開始... " 是挺沒有意義的, 因為這 widget 不能放進 plur...
-
在看排行榜之前, 應該會依幾個角度來看... 1. 媒體的排名, 其中包含傳統媒體在新媒體的成果, 以及純網路新媒體本身. 2. 轉貼站的效應. 3. 個人自媒體的比例. 取樣時間, 上星期, 也就是 7/7 到 7/13 號, 我們來看分享排行榜吧... 分享排...
沒有留言:
張貼留言