
近距離看到一輛汽車時,除了車牌大家最有興趣的應該是:那是甚麼廠牌的車?是普級的Honda?TOYOTA?還是雙B或Audi或Volvo etc.?很多年前至今都有人問我能不能辨識這些廠牌LOGO?我也持續評估,不是不可能,但是難度很高!因為他們不像車牌字元是前景背景對比那麼分明的目標!
這是一個很有趣的題目,因為人眼辨識這些LOGO好像不難?稍微熟悉這些標誌的車主車友們,很少人會認錯的!也因此能一眼就看出是不是昂貴的車種!對於很多服務業來說這是很重要的參考資訊,開車的人也都知道別擦撞到不該擦到的車,賠不起的!大家眼睛都能辨識,也有用處的辨識題目,就是一定會被市場期待的辨識產品了!
我們公司的影像辨識研發一直都很有效率,只有選擇暫時不作的項目,沒有想做卻做不到的!如果我們評估以當時技術能力要做很久,或是預期辨識率不能達到顧客會滿意的程度,又或是市場上已經有其他夠好的產品,我們就會暫時擱置!車廠LOGO辨識這個題目就是這樣被擱置了好幾年。
這幾年我們已經看到不少廠商的軟體宣稱可以辨識廠牌,但認真去看,辨識的正確成功率都很低,所以依舊是一個有商業價值可以做的項目。隨著我們的技術持續提升,在我的RD取得碩士學位後不久,也沒有其他重大研發項目時,我就要求她開始研究這個題目了!
大概兩個多月了吧?她沒有讓我失望,感覺上已經開始上路了!我想此時一定會有很多AI迷會認為用CNN與DL等技術應該很快就能辨識了吧?我們的努力會不會做出趕不上「AI」技術徒勞無功的落伍產品呢?不必擔心的,我的RD碩士不是白唸的!我們師生是比較專精於OCR沒錯,但CNN與DL也是上過課有概念的!
理論上,在複雜背景中尋找已知LOGO,正是CNN宣稱的專長強項,我們知道的!如果覺得有必要,我們也能實作CNN的!但是為什麼至今都還沒有辨識率很高價格合理的產品呢?這已經說明了他們有具體的困難,就是在完全不知道目標概略位置與大小的情況下,像大海撈針一樣,想辨識出數十種可能目標之一的時間成本太高了!
大家不必懷疑CNN或OCR能否辨識LOGO成功?一定都可以的!需要研發的,是如何找出更快更少計算量的方式,很快很省錢的找到LOGO辨識出廠牌,那才是技術競爭真正的戰場!以目前CNN的技術,即使找得到,成本也會很高,必須很多周邊設備(GPU之類的)協助,如果不能在一般電腦上輕鬆執行的辨識軟體,市場競爭力就差了!要做得比CNN快,那是我們一向都保持領先的戰場!
所以我們仍然充滿希望與期待,近期內就可以推出比CNN技術更好更快也更便宜的LOGO辨識功能軟體。怎麼作呢?就點到為止,講一點點吧?

如上圖,我們的目標是鎖定已在近距離(如停車場出入口)成功辨識出車牌的車輛,距離遠的車輛LOGO畫素太少,誰都辨識不出來的,就暫不考慮了!而且LOGO位置必然與車牌位置有關連性,在車牌上方小範圍內找LOGO,我們就不必搜索全圖了!CNN團隊如果想模仿這一招,就先把車牌辨識做好吧!這方面他們還沒我們的技術好。
接下來的問題是:我們的OCR技術通常是不能直接切割出完整LOGO整體的,但是會辨識出一些LOGO中破碎的線段輪廓!我們這次研究最主要的重點,就是發明出如何充分利用這些破碎線段的演算法了!好像在凶殺案的現場,找到的血跡或屍體傷口等具體線索,我們必須善用這些線索拼湊出可能LOGO的形狀範圍與內容,就像警探合理推測行兇的過程。
白話文一點的說法是:要設法用破碎線段找到正確的外框輪廓,不完整的就要用幾何學,如橢圓公式等等去推算出來!一旦LOGO外框被正確定義之後,比對辨識是哪一種廠牌就不難了!以目前的進度看,此案是一定可以成功的!請大家替我的RD加油,拭目以待看她何時能衝過終點!
限會員,要發表迴響,請先登入
- 1樓. 普普2023/12/12 17:52請教! 這和人臉辨識系統的差別。 謝謝!!!有點類似,影像中有像眼睛鼻子嘴巴的特徵組合就可能是人臉,找到位置後再詳細比對是誰的臉! 鄉下老師 於 2023/12/13 03:00回覆












