辨識車廠Logo研究中！ - 鄉下老師

Contents ...

辨識車廠Logo研究中！

2023/12/12 10:12

迴響1

推薦10

引用0

近距離看到一輛汽車時，除了車牌大家最有興趣的應該是：那是甚麼廠牌的車？是普級的Honda？TOYOTA？還是雙B或Audi或Volvo etc.？很多年前至今都有人問我能不能辨識這些廠牌LOGO？我也持續評估，不是不可能，但是難度很高！因為他們不像車牌字元是前景背景對比那麼分明的目標！

這是一個很有趣的題目，因為人眼辨識這些LOGO好像不難？稍微熟悉這些標誌的車主車友們，很少人會認錯的！也因此能一眼就看出是不是昂貴的車種！對於很多服務業來說這是很重要的參考資訊，開車的人也都知道別擦撞到不該擦到的車，賠不起的！大家眼睛都能辨識，也有用處的辨識題目，就是一定會被市場期待的辨識產品了！

我們公司的影像辨識研發一直都很有效率，只有選擇暫時不作的項目，沒有想做卻做不到的！如果我們評估以當時技術能力要做很久，或是預期辨識率不能達到顧客會滿意的程度，又或是市場上已經有其他夠好的產品，我們就會暫時擱置！車廠LOGO辨識這個題目就是這樣被擱置了好幾年。

這幾年我們已經看到不少廠商的軟體宣稱可以辨識廠牌，但認真去看，辨識的正確成功率都很低，所以依舊是一個有商業價值可以做的項目。隨著我們的技術持續提升，在我的RD取得碩士學位後不久，也沒有其他重大研發項目時，我就要求她開始研究這個題目了！

大概兩個多月了吧？她沒有讓我失望，感覺上已經開始上路了！我想此時一定會有很多AI迷會認為用CNN與DL等技術應該很快就能辨識了吧？我們的努力會不會做出趕不上「AI」技術徒勞無功的落伍產品呢？不必擔心的，我的RD碩士不是白唸的！我們師生是比較專精於OCR沒錯，但CNN與DL也是上過課有概念的！

理論上，在複雜背景中尋找已知LOGO，正是CNN宣稱的專長強項，我們知道的！如果覺得有必要，我們也能實作CNN的！但是為什麼至今都還沒有辨識率很高價格合理的產品呢？這已經說明了他們有具體的困難，就是在完全不知道目標概略位置與大小的情況下，像大海撈針一樣，想辨識出數十種可能目標之一的時間成本太高了！

大家不必懷疑CNN或OCR能否辨識LOGO成功？一定都可以的！需要研發的，是如何找出更快更少計算量的方式，很快很省錢的找到LOGO辨識出廠牌，那才是技術競爭真正的戰場！以目前CNN的技術，即使找得到，成本也會很高，必須很多周邊設備(GPU之類的)協助，如果不能在一般電腦上輕鬆執行的辨識軟體，市場競爭力就差了！要做得比CNN快，那是我們一向都保持領先的戰場！

所以我們仍然充滿希望與期待，近期內就可以推出比CNN技術更好更快也更便宜的LOGO辨識功能軟體。怎麼作呢？就點到為止，講一點點吧？

如上圖，我們的目標是鎖定已在近距離(如停車場出入口)成功辨識出車牌的車輛，距離遠的車輛LOGO畫素太少，誰都辨識不出來的，就暫不考慮了！而且LOGO位置必然與車牌位置有關連性，在車牌上方小範圍內找LOGO，我們就不必搜索全圖了！CNN團隊如果想模仿這一招，就先把車牌辨識做好吧！這方面他們還沒我們的技術好。

接下來的問題是：我們的OCR技術通常是不能直接切割出完整LOGO整體的，但是會辨識出一些LOGO中破碎的線段輪廓！我們這次研究最主要的重點，就是發明出如何充分利用這些破碎線段的演算法了！好像在凶殺案的現場，找到的血跡或屍體傷口等具體線索，我們必須善用這些線索拼湊出可能LOGO的形狀範圍與內容，就像警探合理推測行兇的過程。

白話文一點的說法是：要設法用破碎線段找到正確的外框輪廓，不完整的就要用幾何學，如橢圓公式等等去推算出來！一旦LOGO外框被正確定義之後，比對辨識是哪一種廠牌就不難了！以目前的進度看，此案是一定可以成功的！請大家替我的RD加油，拭目以待看她何時能衝過終點！