連續看了幾篇國內碩士生使用深度學習、YOLO或CNN等技術做車牌辨識的論文,上圖的上半就是他們使用的資料集中較「難辨識」的案例,相對於我的客戶給我的路邊機車照片其實是簡單很多的!做這種手拍車牌的辨識那麼多年了,我知道後者才是「日常」照片的常態,前者那麼好辨識的影像根本無需深入討論,或用甚麼學習?只用傳統的基礎車牌辨識技術就可以做得很好了!
每一篇論文的作者其實也都知道他們只是在挑軟柿子吃個口味而已!所以結論都會說目前論文只是個初步測試,「如果」以該論文的基礎,只要有更多更歪斜的資料加以訓練模型,辨識率就會越來越好了?這就是一個永遠不會實現的夢中大餅海市蜃樓了!連他們自己都知道是在青菜共共的!
因為比那些他們的資料集中的影像更高角度更難辨識的影像非常容易取得,到馬路邊用自己的手機隨便拍就有一大堆了!我絕對相信這些研究生有自己拍過,也用自己的模型測試過!你以為會發生甚麼事情呢?一定是辨識率慘不忍睹!硬是提高模型的複雜度呢?譬如增加深度學習隱藏層的層數與參數,即使做了也會因為資料不足或不知如何設計參數而效果很差!
如果他們的路走得通?你以為業界公司就不會嘗試嗎?他們也有碩士博士員工的!可能還更有錢有更多資料跑程式作訓練,如果業界大公司推不出跟我的軟體類似有高角度辨識能力的深度學習版車牌辨識產品,那就是有無法克服的原因!做不到就是作不到!我不敢說是「理論」上不可能!但是成本極高,成功機率極低,絕對是鐵的事實!
我是自始就意識到機器學習這種技術是機率統計學!不僅不夠精確,要靠大量資料逆推出「智慧」成本一定是嚇死人的高!所以即使我一路非常關心也認真學習那些技術,但不到萬不得已我是一定不會採用那些技術作實質研發的!太昂貴也太低效率了!我知道有很多傳統技術可以做得更好更快更省錢!我也用我不斷開發出來的各種影像辨識產品證實了我的理念!
我覺得最糟糕的悲劇是:現在年輕的一代已經因為過度迷信依賴這些統計技術,反而輕視低估了基礎的影像原理與處理技術,他們的物理概念已經與自己操作中的影像辨識技術嚴重脫節了!機器學習與深度學習的黑盒子讓他們變成完全不知道自己在幹甚麼的笨蛋?已經完全不會用物理觀念思考解題了!
事實是:真的有很多基礎傳統的影像辨識技術可以解決這些問題!而且更快更好更便宜!我會用我的事業生涯繼續告訴大家這個事實!科學是永遠不會過時退流行的!精準解題設計演算法才應該是影像辨識技術不變的主軸!深度學習永遠都不會是辨識科學進步的核心!
限會員,要發表迴響,請先登入