
OCR技術是辨識掃描文件上的文字起家的!當它被引用到辨識自然情境拍攝影像中的車牌時,當然必須克服很多更複雜的問題!首先是歪斜變形的偵測與校正,其次是因為各種奇怪的因素讓字元與背景沾連,無法被獨立切割為字元做簡單合理的辨識!
為什麼這類辨識在近年被炒作成好像OCR式微了?即將被類神經網路(CNN)與深度學習(DL)全面取代了?就是因為大多數原本使用OCR做車牌辨識的研究者,沒有好好的面對上述的問題,以OCR為基礎做出正確的研發進化!自己搞不定的事情多了,自然有人會跳出來想踢掉你!
我可以繼續使用OCR技術在車牌辨識產品上獲得的成功關鍵,就是我可以想出很多好方法,在OCR的基礎上繼續挺進,解決上述兩個問題!上面的案例就是一個歪斜蠻大的車牌,還因為後車牌上黑黑的照明小燈的亂入,使得98兩個字元跟背景沾連了!
上圖就是一個很明確可以顯示我的技術內涵的處理過程!我其實只能從原圖上切割定位出67R8四個字,但是這就已經足夠我將車牌的歪斜變形程度偵測出來了!知道歪斜參數之後就可以設計演算法將車牌影像逐步做幾何校正,在此同時,原本未能獨立切割的字元也會隨同被校正成為車牌影像的一部份!
此時在已校正的車牌內,不再拘泥於OCR的限制,用CNN的方式地毯式搜索所有位置的可能字元,因為已擷取的車牌區域很小,不會有CNN耗時太大的缺點,但是之前因為沾連而無法直接用OCR鎖定的字元都會無所遁形了!所以是我替OCR研發的新技術,讓OCR繼續在車牌辨識的領域領先深度學習的!
所以老東西常常未必需要被淘汰!他們常常只需要適當的修改進化,就可能再度超越新技術!不是新的東西永遠比較好的!以車牌辨識來說,其實至今CNN與DL都還遠遠不如OCR的!如果有人跟你宣傳甚麼CNN或DNN的車牌辨識比較好?你必須保持高度懷疑!如果他們沒騙人我的生意早就崩盤了!我就是賣車牌辨是業績很好的廠商,我沒看過好到能讓我緊張的CNN或DL產品,通常他們只是鬧笑話的搞笑產品!
限會員,要發表迴響,請先登入















