Contents ...
udn網路城邦
辨識速度來自合理精簡的計算!抓瞎的訓練學習都沒用的!
2025/01/22 10:23
瀏覽539
迴響0
推薦7
引用0

大家都很容易誤以為AI只有一種?其實AI是一個含括意義範圍極廣的概念!各種目的的AI應用,需要使用到的技術也是五花八門大不相同!有些需要大量資料的統計學習或訓練,有些則正好相反!需要最合理精準的科學推理,大量資料的訓練學習不但對產出更好的AI沒甚麼用處,還會降低AI判斷的正確率

影像辨識就是一個極佳的例子!如果你的目標只是「找到嫌犯」,譬如在街景中找到「類似車牌」的目標,機器學習與深度學習等技術是有點用處的!但是因為它們必須依賴CNN的掃描方式運作,計算量極大執行速度先天上就會很慢,還必須找GPU等額外計算設備幫忙,成本就會非常高了!

但是最糟糕的不是慢而是「不準」!CNN搜尋目標的運算基本上就是降低解析度的過程,但是如果以辨識車牌為例,找到車牌的概略位置只是辨識流程的第一步,接下來還是必須回頭再找到目標區,恢復該處原始最高的解析度,做完整的幾何校正與OCR的辨識流程!低解析的特徵圖是無法正確辨識字元筆畫的!這個過程會相當迂迴,需要的計算量就更大了!這絕對是無解的災難!

CNN技術本身的特性就是簡化與特徵化資訊,本來就不是追求最高準確度的技術!但是幾乎所有的影像辨識都是要追求最高準確度的!所以辨識過程絕對不能「大概對」就好!即使最後答案錯誤,都必須有完整的辨識過程解析,依據完整的科學步驟解釋為何辨識錯誤,這樣才能在辨識出錯時在法律上免責

但是以機率統計為基礎的MLDLCNN是絕對做不到的!只能知道在機率上就是有可能產生錯誤,但為何錯誤?是完全無法追蹤分析解釋的!就像是用大量題庫資料學會猜題的技巧,想考到及格還可以,想考到100分呢?是不可能的!當然這樣的「學習」過程,其實也沒有產生真正合乎科學原理的「智慧」!

我的影像辨識就是跟這些MLDLCNN技術走著完全不同的道路!如果套句傳統AI的術語,我用的理念就是「專家系統」!把每個需要解決的辨識問題以科學原理去理解分析,逐步以各種影像處理技術簡化資料抽取特徵,過程中都不會降低空間解析度,找到車牌位置之後就在原地用原資料繼續處理到辨識完成!

因為每一個辨識程序的設計從一開始就是目標明確地要找到最終的目標(譬如車牌),所以我可以很精確地分析檢討哪些步驟與蒐集的資訊對於最終目標是無用的?哪些計算是重複的,可以資源回收使用!就可以據以精簡流程減少運算,在一樣的硬體效能上,就是計算時間縮短、速度變快還更省電環保了!

我一向非常執著於這種提升速度效能的努力!因為在影像辨識的目的來說,速度快就表示你的演算法精準有效,也代表可以替使用者降低成本,使用上也會更加方便,如果電腦負荷減輕就可以增加更多影像辨識之外的管理功能!使用經驗也會越來越好的!

譬如上圖左是我目前銷售中的台灣車牌辨識軟體的效能,只需46毫秒就能正確辨識這種難度的車牌,已經是相當厲害了!但是我並不以此滿足,因為我知道我的內部流程還有很多計算流程看似不夠精簡,也有一些我從客戶回饋的錯誤資料中知道無法辨識的例外狀況。

所以前面幾個月我研究東南亞車牌辨識時,就大刀闊斧地嘗試使用更多更有創意的新方法,當然都還是以科學原理為基礎,只是在數學方法上追求更高的處理效率!結果也成效斐然,就是說目前我的柬埔寨車牌辨識軟體的速度是快過台灣車牌的!所以我的過年計劃就是把東南亞的研究成果帶回台灣來玩了!

會差多少呢?看看上面的例子就知道了!預期至少是三成以上,而且等我將細節調整完之後,因為可以處理的例外狀況更多了,整體辨識率還會比舊版更高!現階段我的影像辨識軟體已經比MLDLCNN等技術做的東西快很多倍了!以後還會拉大差距,且預期它們會永遠跟不上!抓瞎統計嘗試錯誤的方法技術要在效率上跟上專家系統?理論上就是不可能的

就跟打拳一樣,我謀定而後動,一拳就精準打到對手的要害!絕對比沒學過武功的人七手八腳胡亂揮拳的效果好上百倍!這中間絕無僥倖,也沒有密技或大神加持,就是好好研究基礎科學與數學程式技巧而已!我用的科學原理與數學技巧都是讀自然理工組的高中生都學過的!就像樂高積木也可以做出很龐大精巧的東西一樣,重點是合理與準確的設計!

有誰推薦more

限會員,要發表迴響,請先登入