我的OCR技術是有包含CNN功能的!你怎麼贏我?
2026/01/13 10:01
瀏覽489
迴響0
推薦8
引用0

影像辨識就是要極盡一切方法去辨識出正確的答案,所以雖然我會批評CNN與DL等技術不適合作為影像辨識技術的主軸,但是古人說《史記·李斯列傳》:「泰山不讓土壤,故能成其大;河海不擇細流,故能就其深。」我其實始終都是認真研究並嘗試採用所有可能讓我的辨識更好的任何方法的!其中當然包括CNN!
像上面這個相當模糊的車牌影像,即使我用盡了已知OCR技術的極限,也只能勉強切割出四個數字目標,但是從這四個目標我已經可以合理猜測這是某個車牌的一部份,只要按照車牌可能的格式外推搜尋,是有可能拼湊出完整車牌的!但從無法切割的模糊影像中找到可能的字元不是OCR技術擅長的事,反而是CNN的強項!
所以我毫不猶豫就會使用CNN的技術概念,在這四個字的前後地毯式搜索有沒有很像英數字的目標!這其實並不困難,因為從已辨識到的四個數字,我知道這張車牌的字元應該多大,傾斜變形的狀態也應該跟這四個已辨識的字元一樣,所以並不會像一般CNN毫無前提下的全圖搜索那麼耗時,如下圖所示不過大約0.3秒而已!

所以我的OCR其實已經不只是單純的OCR,也導入了CNN的特徵搜尋技術幫助我解決OCR其實無法做到的模糊辨識功能!所以很多人說OCR的弱點限制就是切割目標不完美時就無法辨識了!但是我的軟體不會!而且可以比一般的CNN更快速地做出很厲害的模糊辨識結果!當然完全不必使用GPU幫忙的!
知道了嗎?就像霍元甲電影台詞中說的:「武功門派沒有高下之分,練武的人有強弱之別!」好的武術專家當然不會(也不必)拘泥於某個門派的武功,能夠旁徵博引左右逢源,因地制宜的隨時採用最佳解決方案當然是最好的!我就是這種不受限於某個門派的武林高手!誰都很難贏我的!
你可能會有興趣的文章:
限會員,要發表迴響,請先登入











