OCR比較好？還是CNN比較好？答案是我的最好！ - 鄉下老師

Top

所有文章 / 目前分類：心情隨筆|工作職場

OCR比較好？還是CNN比較好？答案是我的最好！

2026/02/23 16:16:53

迴響：0

推薦：17

引用0

各位知道為什麼很多人說CNN，就是類神經網路，的辨識方法很厲害嗎？關鍵就是傳統的OCR辨識必須經過二值化目標切割的程序，碰到如上這麼模糊的影像要將字元正確切割出來幾乎是不可能的！但是CNN是直接用特徵矩陣去掃描原圖影像的！只要有個模糊的影子，某些特徵有點像是某個字？就可以經過訓練學習統計後抓(判斷)出來了！

但是CNN的問題是因為事前不會知道字元到底是多大？位置在哪裡？是不是有歪斜變形？等等，所以只能盲目的地毯式搜尋全影像，計算量會超級的大，大到必須努力研發YOLO等技術，在不脫離CNN的架構下盡可能減少運算量。即使如此，最終運算量還是大於OCR數十倍！所以必須仰賴GPU來消化過多的運算量，不然影像辨識就會慢到讓人抓狂了！這也間接讓CNN變成高價位昂貴辨識系統的商標了！

我的辨識技術是以OCR為基礎的！我碰到的問題跟CNN不同，我可以很快速地找到可能是車牌的目標，如下圖。但是顯然它們還不足以讓我辨識出每一個字元！所以我就針對可能的目標區做進一步的幾何投影校正，及影像增強處理，然後再從這些已經比原圖更清楚的小影像中做精準的CNN特徵字模掃描！

所以我終究還是利用到了CNN的模糊辨識能力！可以正確辨識出如上圖這麼模糊的車牌！所以任何人都不能說我的影像辨識技術有任何地方不如CNN了！而且我不必做地毯式的CNN全圖掃描，所以完整的全圖辨識時間還是只需要約0.2秒！當然因為計算量不大就不需要GPU，使用我的軟體就不必買昂貴的電腦硬體了！

所以大家不必再爭論是OCR比較好？還是CNN比較厲害了？答案是兩者可以水乳交融充分整合！你只需要知道逸中軟體的車牌辨識包含了兩大主流技術的精華！兼具OCR與CNN的辨識優點，辨識又快又準又便宜就好了！

回應

全站分類：心情隨筆｜工作職場

自訂分類：不分類

上一則：舉個例子讓你理解我如何導入CNN幫我做好模糊辨識
下一則：改變學生很難，改變自己比較容易，但兩者都能改變世界！

你可能會有興趣的文章：

把我的車牌辨識軟體當事後檢驗的裁判？也行的！
我是台灣最棒的車牌辨識專家嗎？好像是？又好像不是？
辨識正確只是基本要求，極速、省錢與省電才是我的商標！
一個具體的實例讓你想想：是誰的影像辨識比較AI？
充分掌握「明確合理」的資訊，才是影像辨識成功的關鍵！
私立大學教職員月退俸僅2萬多元！你知道嗎？

限會員,要發表迴響,請先登入

	作家：鄉下老師