鄉下老師
原文網址:http://blog.udn.com/yccsonar/180838108
列印日期:2024/10/04
辨識成功的關鍵不在對比強度,而是聰明精準的二值化!
2024/07/23 07:58:21


這是一個非常有趣的案例,看似掉漆嚴重到白字已經完全不像白字了!但是我的軟體還是穩定正確的辨識成功了!這說明了要辨識出你要的目標,它不必是畫面中最突出明顯的目標,只要你能準確抓到目標前景與背景的亮度差異門檻,同樣色系還很黯淡的字元前景與背景在此例中就被準確地找到,就能辨識了!


也就是前景與背景的亮度值只要穩定可區分不會混亂交錯,就可以辨識了!但是這個門檻值必須是動態變化的!如果你要計算出一個全圖的二值化門檻值,在此案例中比需要辨識的字元前景與背景更亮或更暗的目標區域多得是!你統計出來的門檻值不會那麼剛好可以切割出字元!


但是如果可以聚焦到字元附近的小區域看(統計),就可以算出能分辨字元的正確門檻值了!這也是我們用眼睛看較低對比度目標時的方式!這些都是屬於傳統上OCR辨識的技巧!但即使你用了這種技巧盡可能切割出可能的字元目標,但他們是不是對我們有意義的車牌字元呢?還必須有很多步驟的!


首先是要嘗試連結組織相鄰的目標,看他們是不是有大小相似而且成排的規律性?如果沒有,當然就不是車牌了,可以直接忽略!如果有規律呢?就必須開始做幾何校正,將它們扭正到近似標準車牌寬高的矩形,這個經過幾何校正的車牌子影像才是可以用字模進行比對的基礎。


說到這邊,應該除了認真做過車牌辨識論文的人,都已經失去耐心了吧?但不管你喜不喜歡?在識別車牌的「智慧」中,這些都是必要的物理過程!不論你是跟我一樣走傳統路線,針對每一個過程設計出最有效的演算法!或是相信以機器學習為基礎的AI技術,認為只要資料夠多,機器就可以自行產出這種「智慧」!以物理的觀點,要正確辨識自然環境中的車牌,就是必須有這些過程!沒有其他捷徑的!除非你相信有超自然現象可以存在於AI模組?


以我的觀點,正因為影像辨識是非常精緻繁複的智慧執行過程,連多數學術研究者都已經失去耐性,不想認真的繼續用傳統科學的概念探索解決這個複雜的物理問題了!所以才會讓機器學習如此被過度高估期待!這是投了眾人所好的一種集體催眠!真正有深入研究的專家都知道不太可能,但即使是專家都很「希望AI可以做到!那就可以偷懶不必面對解決影像辨識的複雜困境了!


可是事實擺在眼前,以影像辨識領域的實際成效來看,機器學習乃至深度學習與類神經網路,都還沒證明它們真的可以產生準確有效而且可靠的辨識邏輯!即使在特定條件下可以達到高辨識率,但是連操作資料訓練出辨識模型的生產者,也不知道機器自己學會的邏輯機制是如何運作的?所以這種軟體的升級、改版與優化都完全不可能!只能盲目地用更多資料投入模型訓練!有如飲鴆止渴!毒癮越來越大遲早會達到極限崩盤的!就是資料量與訓練計算需求會大到連輝達晶片都救不了你!


而且這種辨識模型的智慧奠基於資料,如果資料條件一有變化,譬如換一支攝影機,換一個取景視野角度或範圍,這些機器自行產生的智慧就會全部崩塌了!很像沙灘上堆出來的沙雕!一漲潮海浪一衝就消失了!機器學習產生的「智慧」是不會有設計圖可以參考據以重建改良進化的!「科學研究」這個概念就等於完全停擺了!只剩下不知其所以然無法用科學原理原則分析處理的大量資料統計數據!


所以你還覺得以機器學習為基礎的AI技術是現代科技的大躍進嗎?我覺得比較像是抽了鴉片就自以為可以刀槍不入的義和團!當毒品耗盡了既有的體能,又沒有繼續鍛鍊出真正的體能,就是繼續發展踏實的基礎科學,當然預期的AI產業就會集體崩潰了!