Contents ...
udn網路城邦
抓到重點再做CNN,我也是幫CNN解套的YOLO研究者了!
2025/02/16 02:21
瀏覽777
迴響0
推薦7
引用0

上圖這張用人眼看似還好,應該不難辨識的車牌照片,但是在我以OCR技術為核心的舊版軟體上是無法辨識的!看過我之前展示的各式歪斜眩光的奇怪照片都能辨識的讀者一定感覺有點意外?但這就是事實!我不會隱惡揚善隨便說謊隱瞞唬弄客戶與讀者的!原因就是它打中了OCR技術的要害!當然現在我已經有解藥了!

看看上圖的四格漫畫加上對於OCR辨識的基礎概念你就會懂了!原因是這張照片略為失焦,對於視覺智慧高超的人眼人腦來說不會造成障礙,但是OCR的程序是將影像二值化變成黑白圖,如上圖中的右上圖,之後再用輪廓線切割成獨立目標,如左下圖,一一檢視之後,事實上會只有那個3字是可以清晰辨識的!

其他幾個字元不是像5那樣變得破碎,就是像96KD那樣變成連體嬰!如果假設它們本身就是獨立的字元目標來做後續分析,就都無法得到正確的結果!最後就是辨識失敗,算是無法辨識的車牌了!老實說,如下圖這樣的影像如果辨識失敗是不會受到客戶指責的,但是上例無法辨識呢?就可能會被質疑,甚至嫌棄了!

老實說,如果上上圖用CNN技術辨識理論上是可以成功的!因為它們不必經過目標切割的過程,就是看某個區塊的特徵,也就是大致的形狀是不是符合某個字元即可!所以即使是破碎或沾連的字元,只要在「正確」的框框內看起來就一定會很像應有的正確字元了!

但是CNN在做任何完整的全圖掃描(Convolution)之前,即使車牌沒有傾斜,也不會預知車牌字元的大小與寬高比,所以如圖二的狀況下,CNN真正的問題是如何找到位置正確,也就是對的那個框框?它們只能逐點掃描,還必須考慮到字元可能的大小差異,必須用不同的尺度掃描很多次!所以運算量就大到爆表,速度慢到讓人抓狂,如果沒有額外的(昂貴)周邊設備如GPU的支援,就很難實用了!

所謂的YOLO(You Look Only Once)技術就是可以只用一個尺度的矩陣掃描全圖一次,達到多次多尺度掃描效果的技術,但資訊是不能無中生有的!它的代價必然是必須有很多條件限制與導致正確率下降的前提假設,所以「找到」字元概略位置或許沒問題,但要精準辨識呢?還是必須做局部的精確OCR處理的!如果我用OCR就可以找到車牌目標呢?其實YOLO的這種努力就完全沒必要了!

所以天下沒有白吃的午餐,需要處理的影像資料百百種,要精準辨識出每種狀況下的每個字元,任何單一的技術方法都不可能面面俱到又快又準又不會遺漏任何資訊的!合理的方向就是因材施教或對症下藥,務實的面對各種狀況,善用整合所有的辨識技術,找到最完美的組合體

雖然這些年我已經一再證明我的OCR技術,在車牌辨識的議題整體上遠遠優於CNN!但是我也必須承認CNN在某些特殊狀況下可以做到我的OCR難以做到的事情,如圖二的辨識就是一個很經典的案例!那我該如何導入CNN的能力到我的以OCR為主體的軟體之中,發揮CNN的特異功能提升我的辨識能力呢?

我之前找到車牌目標的方式是先用OCR篩選出所有可能的可分割目標,所以如圖一左下的破碎與沾連目標們都會入選,但是接下來我想找到大小寬高比類似的緊密排列目標來定義是不是很像車牌字元組時,那些破碎與沾連目標參雜的組合怎麼看都不像合理車牌的!所以我不會讓它們進入後續處理,事實上正確的車牌目標組合就直接淘汰了!

但是現在我想到一個簡單的方式可以挽救這種遺珠之憾!以圖二為例,雖然只有一個3字非常正常可以辨識為高符合度的字元,但是我已經可以合理懷疑它可能是某個車牌中的一員!所以就以它的大小寬高比作為CNN的特徵矩陣框架,仔細掃描它的左右區域,就可以順藤摸瓜,用CNN的技術把所有破碎或沾連的字元全部抓出來了!

比起之前必須找到四個排列成行的目標,我才會啟動後續辨識程序的門檻低得多了!所以圖二的狀況現在不會無法辨識了!符合度還很高!這都是我善用CNN技術的效果!但是當然如果這個車牌是傾斜變形的,我又在抓到單字時無法預知它是傾斜的,就不會高符合度的辨識出此單字是某個字!這個程序也就無法成功了!

如果我硬是要將這種清晰的種子目標做多個角度的旋轉找出它的旋轉角度呢?當然也是可以的!如果旋轉某個角度之後這個字就有了極高的符合度,那就表示我也知道車牌的傾斜角度了!我就可以在非水平的方向上執行CNN掃描來找到正確的周邊字元了!這種程序我目前是還沒做,會不會做呢?就看CP值了!如果運算時間不會超標,又可以提升辨識率,我就會實作出來了!

這個新設計我覺得有趣的是:我好像也加入YOLO的研究行列?努力替CNN找到不必運算太多就可以發揮其優勢的方式?所以萬流歸宗,不管黑貓白貓,會抓老鼠的就是好貓!如果可以精準訓練編制成最有效率的捕鼠貓聯隊呢?那就太好了!我就是這樣做影像辨識的!我覺得大家應該朝這個方向努力!OCR與CNN不只是競爭對手,也應該是可以密切合作的夥伴!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入