Contents ...
udn網路城邦
要做好車牌辨識,你必須能找到失落的一環!
2023/12/01 05:08
瀏覽530
迴響0
推薦13
引用0

車牌辨識的辨識率就像學生考試的分數,是個相對的量化評估,題目太難時頂尖資優生一樣會不及格!反之,考題簡單時大家都能考一百分!我讀建中時,某次模擬考化學科特別刁難,全校平均居然只有16分?我的化學不是強項,但因為粗心沒看到考卷背面也有考題,專心只作一半題目反而得到32分,居然是全班第二高分?很有趣的,現任的賴清德副總統與我同屆不同班,當時也有一起考,不知道他拿到幾分?曾跟我同班的朱立倫主席當時已經轉讀社會組,不考化學的,躲過了這次慘案。

多數人不懂影像辨識,也不想像老師傅一樣蹲馬步練苦工,點點滴滴的打好基礎徹底掌握所有知識技術。加上AI詐騙集團的推波助瀾,讓多數人都有過於浪漫的幻想?以為在雲深不知處,就是有某些神奇的演算法可以如仙藥一般能治百病?而且這些神奇的AI演算法還不需要你費力尋訪,讓機器自己摸索學習就可以找到了?真的是在作夢!

我基本上認為將很困難複雜的影像辨識研發丟給機器學習(或深度學習)去摸索是很沒效率也必然不會有太好成果的!所以十年來我一直是以傳統的影像辨識學理技術為基礎,不斷累積經驗與用我的創意小聰明發明一些新的演算技巧去解決更多自然情境下會出現的辨識障礙。

事實證明我的影像辨識事業總是可以用這種方式持續進步,辨識率的提升對我來說不是甚麼神奇的AI發明?只是點點滴滴研究病因對症下藥醫好所有小病的技術發明累積的結果而已!在不使用流行的MLDLCNN等所謂的AI技術狀況下,我這個毫無資本挹注的小公司已經屹立於影像辨識市場快十年了!

舉個很重要的小例子給大家看,如上的車牌是個讓人扼腕的狀況,人眼視覺上看起來還算清楚,任何視力正常的人都不會看錯車號的!但是因為車牌底座凹陷,導致上排字的上方略有陰影,使用傳統的OCR二值化切割後就會變成這樣:

如果沒有作特殊處理,那個A字會與背景沾連,不會被視為獨立的字元,辨識出來的結果就會少一個字了!懂得影像辨識技術的人一定會想:只要調低二值化的亮度門檻應該就可以成功切割了!但真實環境甚麼狀況都有,也有可能A字在亮度變化上也完全與背景相連的!門檻調得太低,正常的字也可能破碎的!

正如吃藥打針開刀,所有醫療方式都是有副作用的!要醫好病痛又不能傷身,達到最終身體健康的目標,這不是簡單的求得唯一解答的事情,影像辨識也是如此!最終目標是得到最合理正確的辨識結果,這是一個非常複雜多變的難題,好醫生的錦囊之中能醫好某一種病的策略一定很多!想用一招半式闖江湖是一定不行的!因為每個人與環境狀況都不一樣,重點是醫生必須真的知道狀況作出最好的醫療選擇!

我當然知道調整二值化門檻的技巧,但是我也知道猛藥不能亂下!而且調整門檻是個全圖的作業程序很耗時的!也不保證一定可以成功。但是從另一個角度思考呢?當我已經得到A以外的所有正確字元時,從車牌格式與幾何分布,依據正確的越南車牌格式,我可以明確知道在A那個位置,應該有個英文字母!我漏掉了!

因為整個車牌的其他字元我都用OCR方法辨識成功了!我可以推算出那個失落的英文字概略的大小與位置,我就可以像CNN一樣,建立一個框框去那個遺失字元的位置附近做「卷積」(Convolution)運算找到那個字了!跟CNN不同的是:我只需要在極小的範圍內找失落的目標,而不是全圖地毯式的搜索,計算量相對是極少的!當然就不必驚動GPU了!

就是這樣!我設計出局部的類似CNN卷積運算,找到了這個車牌辨識失落的一環!如果我有一百個樣本,解決這個案例之後辨識率就提高一趴了!這就是我的日常研發實況!我也覺得這才是正確的影像辨識研發方式,整天找資料不斷調整辨識模型去讓機器學習?那是抓瞎找明牌買樂透!我沒那麼多時間與經費可以浪費的!這就是我的公司存活多年未倒閉的秘訣了!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入