Contents ...
udn網路城邦
你說車牌格式的考慮重不重要?
2020/11/06 06:58
瀏覽756
迴響0
推薦7
引用0

最近研究的專案是用極高解析度(幾千萬畫素)拍攝街景辨識車牌,解析度高了,但是畫面上的車輛有遠有近,以物理定律來看就不可能每一個車牌的焦距都是很準確的,所以即使車牌字元好大,但卻常常是模糊的狀態。我的演算法其實之前沒遇到過很多「字很大但是卻很模糊」的案例,所以這幾天都是在調整這種狀況下,我的辨識流程中的缺點與決策能力。下面就是一個有趣的例子,

這個車牌如果用一般的影像解析度在街上拍攝,應該是無法辨識的!因為下面那張綠色貼紙太靠近車牌字了,很容易將字元連成一大塊無法切割,看看下面的灰階圖就有感覺了!如果解析度下降一半,字元和貼紙之間就會藕斷絲連了!

但是因為解析度夠高,即使影像模糊,還是可以用二值化程序準確將字元切出,如下圖看起來應該可以輕易辨識成功收工了吧?

 

但是車牌外側的一塊小陰影跑來插花,在二值化的圖上,它怎麼看都像個1I字,如果是一般清晰的車牌影像,我可能會用較嚴格的字型去判斷它不是個字元,而將它排除。但是在預期就是有點模糊的影像上,我不能讓字型篩選太嚴苛,不然很多真正的字元,只因為焦距不準確變得模糊就會被意外淘汰了!

怎麼辦?得到一個「IBWY-570」的奇怪車牌,難道就這樣結案嗎?我自己都知道台灣絕對沒有這種格式的車牌!知道必錯的答案還要硬著頭皮報告出去嗎?但是要我承認這個車牌「無法辨識」我也會嘔血盈升的!這太可惜了吧?答案都這麼接近了,猜也要猜一下最可能的正確答案吧?

其實真實世界的影像辨識不能只考慮影像的資訊,還要考慮到所有條件因素,必須得到(或猜出)「合乎規格」的最佳答案!因台灣根本沒有4-3格式的車牌,你猜如果有一個字是多的,最可能是誰呢?當然就是最左右邊的字了!拿掉左邊變成3-3,拿掉右邊變成4-2,都是可能的車牌格式。

但是繼續考慮到「IBWY-57」也是不符合格式的!監理單位跟我說的,那兩個字元的段落通常不會是全數字,即使是也一定是相同的數字,譬如「77」或「88」之類的!所以正確答案就只能猜「BWY-570」了,也真的就是正確答案!

所以真正的「AI人工智慧」很難簡單規範定義的!這個案例在其實影像辨識已經錯誤,我們利用了影像外部的條件資訊,至少避免了必定錯的答案,譬如選擇題有四個選項,影像辨識計算結果說要選5,你會選嗎?當然是在1-4之間猜一個最接近的答案囉!我們不是天天都這麼處理事情的嗎?你考試時有幾次完全不必猜答案的啊?合理的猜測寫成程式就是AI了!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入