這是一張我創業之初就碰到的難題,一直是高懸的不可能任務之一!現在已經可以辨識了!關鍵就是我的OCR(光學字元辨識)技術已經開始引進CNN(類神經網路)的技巧,也避開了CNN運算量太大的缺點,補強了OCR在模糊辨識上面的先天弱點!基本上就是利用少數可以清晰辨識的字元為基準點,在其周圍用CNN掃描的方式找到那些破碎的字元!
其實這種技術整合目前還是有很大限制的!因為CNN有預設的矩形運算框架,不管是特徵矩陣或圖形掃描都很難用於處理傾斜變形的車牌,所以這種辨識爛車牌的能力只限於停車場環境!在此車牌一定都是非常接近水平正面拍攝的,符合CNN的使用限制!就是用字模矩陣水平掃描!傾斜較大的車牌就沒辦法了!硬要用CNN做傾斜辨識不僅難度太高,運算也會更加失控!GPU都就不了!
很微妙的是即使CNN似乎已如日中天,多數人可能以為影像辨識已經都是使用CNN在做了?但事實不然,即使每個賣車牌辨識的廠商都會蹭AI的熱度,故意說得很含糊,想誤導客戶以為他們的車牌辨識是用這些較新的AI技術做的?但事實上都不是!不只車牌辨識如此,幾乎所有的影像辨識商用軟體都是如此!
原因是如果真的採用完整的CNN技術做車牌辨識,運算量太大成本會太高的!客戶如果要讓CNN軟體跑得跟OCR軟體一樣快速就必須買很高檔的電腦,再加裝很多GPU周邊設備與搭配的軟體之類的!以商業上總是會努力降低成本的考量下,只要傳統的OCR車牌辨識技術夠準確夠用,廠商就絕對不可能改用CNN架構的軟體!
理論上CNN的模糊辨識能力是高於OCR,所以整體的辨識率是可以高於OCR軟體的!只是運算量會多很多倍,也代表硬體成本與耗電量會多很多倍!但是傳統(非CNN)的車牌辨識軟體就已經可以達到98%以上的辨識率了!CNN再好也差異很有限,如上圖這種爛車牌應該是萬中選一吧?為了辨識萬分之一的車牌增加好幾倍的成本?沒人這麼笨的!就像其實只有炫富的極少數人會買千萬超跑名牌包的!就是用數十倍的價格買多個幾趴品質的意思!
所以大家可以很確定知道市面上大量使用的各種車牌辨識軟體一定都「不是」使用CNN架構設計的!因為沒必要花那麼多錢!殺頭的生意有人做,賠錢的買賣一定沒人做!多數賣車牌辨識系統的專業廠商一定都知道我說的上述事實,但是因為客戶多半不懂嘛!所以能混就混,能騙就騙了!反正每一家會自稱很「AI」的!如何具體執行實現他們說的AI呢?都語焉不詳的!
我不喜歡打迷糊仗,也認為事實越公開透明,對於消費客戶的權益越有保障!對於推進AI影像辨識技術的實質進步也越有利!所以天天在這邊說實話!我知道CNN的模糊辨識能力好,我也希望我的OCR軟體增值,所以我就努力將CNN的優點有條件地融入我既有地OCR軟體,讓客戶不必花更多錢就可以同時享有OCR與CNN的雙重優勢!
所以我的軟體就是以OCR技術為主體,加上局部區域使用CNN技術來提高模糊字元的辨識力,已經兼具OCR與CNN的雙重優勢!最重要的是計算量並沒有大幅增加,所以使用者不必花錢買更好的電腦,辨識速度也不會明顯變慢!我就是這麼作的,至於別家車牌辨識的AI具體作法是怎麼樣?大家可以去問清楚!總之不要一聽到AI就像吃了迷幻藥一樣糊塗上當就好!AI絕對是可以清楚解釋的科學技術!不要變成宗教迷信了!
限會員,要發表迴響,請先登入