神奇的影像辨識能力，OCR完勝CNN！ - 鄉下老師

Contents ...

神奇的影像辨識能力，OCR完勝CNN！

2023/10/06 05:33

迴響0

推薦7

引用0

能辨識出這麼歪斜且模糊的車牌，即使對我自己來說都是蠻驚喜挺神奇的！這些多數車牌辨識系統認定不可能辨識成功的案例，就是我日常研究的主要課題，即使是這種難度，我的辨識成功率仍然有一半左右！我不會故作神秘暗示我有甚麼AI密技？我沒有大家聽不懂的神奇秘技！我只是盡可能符合常識與直覺地善用所有可用的資訊去努力解題而已，至於這算不算AI呢？就留給讀者們評論了！

我始終強調我的車牌辨識技術就是以傳統的OCR技術為基礎！裡面沒有任何ML、DL或CNN的成分！我的研發或許讓OCR進化變強了，但基本架構還是典型無誤的OCR！如果你堅持認定非得使用那些ML、DL或CNN技術才能稱為AI？我的存在就會讓你非常尷尬！因為我可以辨識的難度與速度都是市場上頂尖的水準！目前還沒有任何使用ML、DL與CNN技術製作的產品可以跟我的產品抗衡！

以我的角度看，那些號稱AI影像辨識的技術已經被哄抬炒作多年，早就應該有很厲害甚至超過我的車牌辨識軟體問世了！如果還是沒有呢？大家應該質疑的是：那些AI影像辨識技術真的有用嗎？但是因為AI對大眾的洗腦太成功了，我「看起來」就變成不合群的黑羊，明明已經率先推出很好的產品，多數客戶反而會質疑我不用「AI」行嗎？不會很快就「落伍」了嗎？

這是很奇怪很尷尬的真實狀況，據我所知不只是我，其他已經上市的各家車牌辨識軟體核心也都不是用那些所謂的AI技術做的！但是他們多半為了蹭AI熱度，或不想冒犯客戶的錯誤認知，不是含糊其辭，就是公然說謊！說他們也是用那些技術研發車牌辨識的？這種事我真的做不出來，只能甘冒大不諱得罪AI了！

我覺得高來高去的爭辯其實沒有意義，我也希望那些AI技術終於能夠成功做出很好的車牌辨識，讓這個領域的技術更多元化，我也可以藉著這些技術讓自己的產品更好！在此之前我就希望更清楚的揭露我的技術內涵，讓大家更信任我的產品！白話文就是讓大家知道我沒說謊，我真的可以用OCR就做出好產品！

模糊車牌的問題就是使用OCR的二值化程序之後字元目標不會粒粒分明，如上圖所示，我們想找的字元都破碎沾連得很嚴重！但我們還是可以盡量找出目標排列成一直線，大小差不太多的特徵將他們群組起來，如下圖：

即使已經篩選過的目標排列組合的可能性還是多不勝數，我們會用非常多輔助條件排除過度畸形的組合，譬如相鄰目標相距太遠之類的！找到可能的組合後我們會將歪斜車牌扭正為標準車牌的大小，就是所謂的正規化(Normalization)，在此過程中我們會擷取原圖的灰階乃至RGB資訊一起正規化，再做一次車牌內部的二值化，此時呈現的字元就會讓人驚喜的很清楚了！

我不會遮遮掩掩隱藏我的技術精要，反而願意公開取信於客戶，主因是AI的宣傳廣告勢力太大，讓我這種正常的研發工作都被質疑。我不想搞神秘，甚至期待更多初學者相信我的存在，相信我的方法不但可用，還超越ML、DL與CNN能在影像辨識上做到的事，不要浪費時間沉溺於那些哪裡都去不了的AI技術。

我不怕因為洩漏核心技術失去產品優勢嗎？不會的！我的這些「發表」，包括我寫的書，都可以讓大家知道我的這條路穩健可行，但我知道主幹道之外的完整路網，鉅細靡遺的各種分支處理也是整體辨識率可以高到商業等級的必要旅程。任何人都可以很快知道我的方法是對的！但要真的跟上我的辨識率與速度，必須再打磨個三五年！只要我還在繼續前進，想要超我的車還是很難的！

我的結論是：完美的影像辨識絕對不是來自某一種神奇的演算法，而是你的演算法可以充分利用到所有影像內部，到影像之外的所有資訊，包括車牌應有的格式與顏色等等。就像人的視覺解讀看到的影像一樣，我們一定會善用所有看到的影像特徵，與以前經驗過或學到的知識，做出最完整合理的判斷！

大家真的不必妄想有甚麼AI密技可以一套用就跟人的眼睛大腦一樣聰明？就跟有人Line你某個投資標的可以保證獲利一樣，不可能的！如果有人這麼跟你說就確定是詐騙無疑了！投資詐騙靠的是多數人不懂金融市場的常識，AI詐騙呢？就是靠著大家都愛AI，卻都不夠了解AI，我希望大家都謀定而後動，真的夠懂AI時再做決定！

植基於卷積神經網路之高效能車牌辨識系統

An Efficient License Plate Recognition System using Convolution Neural Network

上面是一篇認真使用CNN技術做車牌辨識的論文，算是寫得很清楚了，大家有興趣可以參考一下！跟我說的OCR做法比較，他們要實作完所有程序的困難度真的高出OCR好多！即使架構那麼複雜，但是對於歪斜的車牌還是毫無辦法的！也可以想像需要使用的辨識時間絕對不會很短，至少不會像我的程式那麼快吧(如下圖)？所以他們沒有GPU是活不下去的！即使有GPU相助，他們的商業產品還是難產中，應該就是辨識速度實在太慢了！買超級電腦來跑呢？客戶又嫌貴不買了！我用OCR就完全沒有這種問題。

辨識率方面也可以概略做個比較，上面論文中提出的數據是：車輛偵測率96.12%，有車輛目標後再從其中偵測車牌，車牌偵測率是94.24%，抓到車牌後「整體字元辨識率」是99.2%，請注意到每個車牌是有六七個字元的，所以1000個字元大概會來自1000/6.5≒154張車牌，錯8個字元就是大概有8張車牌是辨識錯誤的！車牌辨識正確率就是大約(154-8)/154≒95%了！一般業界說的車牌辨識率是： 正確車牌/車輛數 應該是：

0.9612 X 0.9424 X 0.95 = 86.05%

這個數據已經很接近一般公務機關道路車牌辨識驗收標準的90%了！如果這是真實的效果，此論文是2018年提出的，CNN又是大家說的主流的技術，五年後的今天是不是早就應該有商業化的產品了？也是做個比較，我這個沒資源的小公司2015年創立研發自己的車牌辨識核心，5年後我的動態車牌辨識軟體早已經行銷全台了！研發「團隊」只有我和我的RD兩個人！

如果擁有極大資源的CNN五年後還是沒有推出商業產品，必定是有難以啟齒的困難吧？譬如從上述論文看就知道結構如此複雜，程序那麼多，計算量一定很驚人的！又會走到成本太高的死巷子了！而且如下圖的街景情境，我的道路全景多車辨識率已經達到95%了！所以即使CNN車牌辨識現在立即上市，都是比我弱勢，辨識率低約10%還更昂貴的次級產品，CNN必須加油了！或是早點放棄不用了吧？用OCR好太多了！