鄉下老師
原文網址:http://blog.udn.com/yccsonar/180798591
列印日期:2024/09/10
困難的車牌辨識就像CSI專家從殘破的屍體上找真相!
2024/07/10 05:10:35


AI影像辨識的工作很困難,我天天在研究超過10年了!除了極盡自己的創意思考之外,也天天在努力學習,很希望從他人的研究中擷取養分!尤其是車牌辨識這個我研究的主要議題!雖然我不是資訊領域的學歷,但我們讀到碩博士就是受過這種知識學習訓練的!希望可以經過學習攀上科技歷史巨人的肩膀往前看,想另闢蹊徑獨樹一格做出截然不同於主流科技的新科技,不是不可能,但畢竟太難了!


但是我蠻失望的,從MLDLCNN等所謂熱門的AI影像辨識「主流」技術的相關資訊中,我看到他們都還只是停留在如何「找到」目標的階段,如何在找到殘破或歪斜車牌之後正確重建車牌完整正確的影像,得到正確車號的部份幾乎毫無著墨!但如果只是找到不正確或不完整的車牌,無法告訴使用者正確的車號,是完全沒用的!


CNN等技術最喜歡談論如何在複雜背景中找到貓狗等等輪廓與特徵不是很明確的目標,這個確實很厲害!但現實需求上,只是「找到」目標常常還是不夠的!就像警方偵辦謀殺案,只是找到受害者的屍體是不足以破案的!還必須從可能已經腐爛甚至殘缺不全的屍塊中重建死者身分與犯罪過程,如果屍體不能被證明就是偵辦案件中的受害者,或死因與犯罪無關,那當然就沒意義了。


所以影像辨識技術的良莠,或AI能力高下的分野不只是能否「找到」目標而已,還必須包括如何「重建」正確理想影像的技術!如果車牌目標都很清晰,找到之後毫無困難就可以正確辨識出車號,就像停車場的車牌辨識,其實任何廠商的軟體都能用的!如果我的技術僅止於此,我的公司早就被其他大公司的財力與廣告擠出市場之外了!像我這種無財無勢的小公司,僅是「跟上」別人的技術是不夠的!我必須超越所有人的技術才能活!


我的公司能存活至今的技術關鍵,就是我不僅可以擁有類似(甚至超越)CNN的能力,在複雜背景之中「找到」相當模糊甚至歪斜的車牌,更重要的是我可以利用很多周邊資訊與幾何學知識正確「重建」出應有的車牌,從而得到正確的車號!我的技術其實不只是有異於MLDLCNN等熱門的AI技術,而且是猶有過之明顯超越領先他們的


像上面的例子,車牌模糊且歪斜還與背景沾連,我極盡我知道的二值化策略也只能找到如下圖那麼殘破的資訊:



就像警察偵辦分屍案時差不多,即使已經找到屍體,負責鑑識的CSI專家的工作還是很艱鉅,必須根據所有的殘缺資訊合理的復原重建這個屍體的身分樣貌,甚至死因與犯罪過程等等,看到我用演算法建立的歪斜網格了嗎?就是必須那樣才能將車牌投影成正面的矩形影像的!即使是嘗試搜尋補足漏掉的字都必須依據這個網格斜向搜尋的!


這種重建車牌影像的相關技術當然是我可以辨識高傾斜變形車牌的主因!但不論是傳統的影像辨識書籍或現在熱門的AI技術文獻都極少談到,我的這種資料處理複雜度是遠勝過這些公開文獻的!所以之前曾建議我的RD,如果想繼續讀博士,這些技術就是最佳的博士論文素材了!太有料了!


所以任何困難的影像辨識都不會是甚麼浪漫神奇或神秘的超自然過程!而是精確縝密的科學資料處理過程!用大量資料給機器學習訓練,就會有神奇的辨識能力出現?這種AI神話其實從未發生過,以後也不會發生!影像辨識如果只需要看個大概,只需要七八成辨識率是可以考慮使用ML、DL與CNN等技術,如果要求95%以上的高辨識率,終究必須回歸正統的科學研究,絕對無法仰賴機器學習等機率統計學達成的!


正如讓老鼠花很多時間嘗試錯誤學會如何走出迷宮,就不如用人腦直接寫出最佳策略的過關程式!因為效率差太多了!這是常識!機器學習派的AI專家們正在引導我們違反這種基本常識!你能有多笨呢?會相信這種鬼話嗎?