AOI與OCR才應該是影像辨識的主流，絕對不是機器學習！ - 鄉下老師

Contents ...

AOI與OCR才應該是影像辨識的主流，絕對不是機器學習！

2019/08/29 05:45

迴響0

推薦10

引用0

我一直對於機器學習與深度學習佔據了影像辨識發展的主導地位非常不以為然！但是我之前也一直沒有在我的言論中具體的提出：那甚麼技術才應該是影像辨識技術合理的主流呢？難道是鄉下老師發明的獨家影像辨識技術嗎？當然不是的！所謂的「德不孤必有鄰」，我絕對不會剛好是滾滾紅塵(濁流？)中唯一醒著的人！我更不是影像辨識領域的先驅！比我聰明努力的前輩可多了！

影像辨識的理論概念出現的時間，大約是20世紀中期，遠遠早於機器學習、類神經網路與深度學習這些名詞的出現！難道在這前面幾十年間，學界與業界都沒有發展出實用的影像辨識技術嗎？當然有！那就是AOI與OCR兩大領域！大家有興趣的話，可以先參考以下的連結取得一些基本概念：

自動光學檢查光學字元辨識

簡單說，OCR的目的就是辨識出影像中有意義的文字或數字，這些文數字基本上會是影像上面可以切割出來的獨立目標，我們再將這些目標去比對字模，就可以知道他是甚麼文字！AOI則是辨識出某些我們想辨識的特徵，不限於可切割獨立的目標，涵蓋的技術其實更廣！但是因為影像辨識在自然環境背景中很困難，所以OCR的辨識對象多半侷限掃描文件，AOI的辨識則局限於實驗室或生產線上的簡單影像。

因為我不是科班出身，所以上面兩種影像辨識的主要發展應用領域，我也是誤打誤撞，已經開始使用之後才知道前輩已經做了好多事情！簡單說，我目前用來賺錢的技術根本就是以上兩個領域的綜合延伸應用！跟機器學習、深度學習與類神經網路是毫無關係的！

重點是：我僅使用AOI與OCR的基礎技術，完全不理會機器學習等「熱門」技術就可以在業界存活！看起來還前途非常光明？那是甚麼意思？我認為就是影像辨識的主角應該換人了！不論是AOI或OCR都是具體根據需要辨識的目標，做演算法研究的傳統科學。我作車牌辨識的方式，其實是將OCR的文數字辨識概念推進延伸到3D的立體世界，在過程中我不斷碰到必須解決非文數字的環境雜訊問題，我不知不覺用到的卻都是AOI領域的技術。

總之，AOI與OCR的技術領域中，已經做到的事情都是一清二楚的，最多只是某些公司基於商業機密不願公開而已。那些東西絕對是可以繼續研究累積的科學知識與技術，但是機器學習派已經做到的，譬如可以讓電腦下棋贏過棋王的演算過程，連程式設計者本身都不太清楚軟體是怎麼贏的？那要如何繼續傳承與研發進步呢？如果他很清楚贏的過程與原因，那直接用作者的人腦下贏棋王，自己做棋王不好嗎？

所以我一直強調：機器學習、類神經網路與深度學習，都不是真正的基礎科學，那些都是不知而行的統計學，是進化版的：星座學、八卦五行、紫微斗數、占卜、或者塔羅牌！真正的影像辨識科學是甚麼？你不需要相信我有多厲害，只要相信AOI與OCR這兩個領域已經有的成就技術是真的！因為我其實就是前面兩種技術的綜合使用者！

如果不知而行可以解決所有影像辨識的問題，我也沒意見！我不懂車子，不會修車，天天開自排車也很好啊！但是實際上影像辨識的問題太多太複雜，現在就開始用機器學習抓瞎，只會延誤我們針對各種影像辨識應用研發的腳步，所以別傻了！真正要研究影像辨識踏入業界，大家應該關注學習的是OCR與AOI，絕對不是機器學習等等東西。

各位知道為何會有這個「逆流」出現嗎？其實就跟我們還是會想算命一樣，因為世事難料，即使我們窮盡一切努力，很多事情我們還是抓不準！如果你相信事實與科學，會繼續努力掌握事實現狀，實在無助時就會求助於宗教或一些統計的可能性，機器學習派就是這樣趁勢而起的！他們有價值與意義，但絕對不應該是科學發展的主流主體！

除非他們開始真的面對每一個個案的成敗原因分析與處理，否則他們永遠只能是進階的算命軟體，但是脫離統計與猜測的本質，他們也就沒有獨立存在的意義了！不是嗎？簡單說，他們只是當OCR與AOI力有未逮時的輔助工具，絕對無法取代真正的影像辨識科學研究，如果你堅持相信可以！你就是相信有長生不老藥的秦始皇，秦始皇沒找到仙藥，還被徐福騙走了好多錢和三千童男童女！祝你運氣比較好，能找得到靈藥！