Contents ...
udn網路城邦
影像辨識不是甚麼玄奧密技!只是常識的總和!
2025/10/21 10:13
瀏覽627
迴響0
推薦9
引用0

車牌辨識好像只是一個單純的技術名詞?但是要在各種環境狀況中都能正確認出車牌,是個非常複雜困難的認知智慧!一樣是在做車牌辨識的廠商,可以提供的軟體難易程度常常是天差地遠!停車場堪用的車牌辨識,相對來說只是小學生的程度!最困難的應該是就是如上的毫無限制的街景中的車牌了!我已經研究了超過十年,天天都還是有很多的議題可以研究!

因為要盡量辨識出各種歪斜變形狀態的車牌,所以目標篩選的門檻就必須放得很寬很低。即使如此,上面影像中真正的那兩個車牌,還是太歪斜模糊超出了我目前軟體的智慧程度,都是無法辨識到的!左邊那輛黑車的車牌用人眼的智慧是可以辨識的!也就是我繼續研究的目標!右邊白車的車牌連人的視覺智慧也無法辨識,我就不會強求了!

但是這麼積極的辨識態度也會有副作用的!譬如上面的例子就是把幾個整齊排列的窗戶當成是車牌AJJ-1711了!這種奇怪的答案在街景的車牌辨識中是很常見的!但是當然不能太常出現這種會讓使用者困擾的垃圾資訊!我的軟體必須盡量攔截不可能是車牌的答案,我稱之為鬼影辨識,見鬼的事當然是越少越好!

所以碰到這種情況時,就要思考在辨識過程中有哪一個步驟時可以發現明顯不合理的現象?提前否定這個目標是個車牌!這樣就可以避免無意義的答案還能節省運算時間!但是如果鬼影車牌還是通過重重關卡跑到終點了呢?還是可以用一些簡單的檢驗發現它很奇怪?不可能是車牌的!

譬如上例七個「字元」的間距分別是:24,48,4,48,34,28,如果它真的是車牌這種間距分布就太不合理了!既然是AJJ-1711的話,第三四個字元間距應該會最大,它反而是最小?譬如下圖車牌的字元間距是:10,12,11,15,113H之間有短格線距離應該最大15,其他幾個間距則應該相差不多10-12,就是合理車牌了!所以參考這項資訊後,AJJ-1711這個答案就當然不是車牌可以被排除了!

由這個例子可以看出,AI研發其實可以很人性化的!以我的觀點就是我們對影像理解的常識總和!如果你的想法與知識都可以用程式語言充分表達出來,AI就距離不遠了!並不是一定要依賴大量資料,不問緣由也不知所云,的讓電腦去統計(機器學習)才能做出AI的!

ML只是一種方法,還未必是最有效最精準的方法!以影像辨識而言,使用MLDLCNN來開發軟體更是很糟糕的下下策!要做出穩定可靠可以持續優化升級的影像辨識軟體,用MLDLCNN是絕對做不到的!你必須學我一樣,把影像中發生的每件事都想清楚,也用程式寫清楚才行!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入