歪斜車牌的幾何校正怎麼作!連Google AI都跟不上我的! - 鄉下老師 - udn部落格
鄉下老師
作家:鄉下老師
文章分類
    Top
    歪斜車牌的幾何校正怎麼作!連Google AI都跟不上我的!
    2026/01/06 11:00:26
    瀏覽:339
    迴響:0
    推薦:12
    引用0

    圖一、我的車牌歪斜變形幾何校正程序圖

    現在的車牌辨識技術,專業與業餘水準之間的最明顯界線,應該就是歪斜變形車牌的辨識能力了!如果還是限制水平傾斜不能超過10度之類的軟體就算是業餘的次級品了!這種產品不是不能用,但是既然有更好的產品可買,碰到這種廠商你就直接殺價一半再跟他議價吧!因為真的已經有可以處理歪斜變形的車牌辨識產品了!而且變形的幾何校正學問很大的!各家先進廠商的作法也不盡相同!如下我問Google AI這個問題,得到的答案是這樣的:

    AI說的「定位車牌的四個角點座標」已經是我上一代軟體的過時作法了!所謂的「四個角點」其實就是要先辨識出可能車牌字元區的「上下左右四個邊界」!必須有了四個邊線才能產生四個頂點(交點)嘛!這個方法我也用了很多年,但是有個很大的問題導致很多時候很不穩定!

    就是字元區的上下邊界有很多參考資訊可用,要從多個字元的頂點或底點找出穩定的邊線完全沒有問題!但是左右邊線的決定就很難了!因為不同的字元,左右邊的切線線未必是與字元的中軸線平行的!碰到如AFJLPT等等上下不等寬的字元擺在兩邊時,要很正確的決定左右邊線絕對不能只是做個切線就行的!

    我也嘗試過很多複雜的方式找左右邊線,但總是有漏洞,計算過程還很耗時!所以最終就完全放棄找四邊四角的辨識邏輯了!如圖一所示,我是先找出字元排列的傾斜度,先做簡單的旋轉,確定每個字的底部都是一樣高之後再以此半成品的子影像繼續下一步的校正!

    比較簡單的狀況是所有字元會往同一個方向左右傾倒,我只要嘗試找出哪個傾斜度可以找到最多穿越字間空隙的線就知道整個車牌的左右傾倒程度了!這個處理方式在我寫的「影像辨識實務應用 使用c#」那本書上就有詳細的範例程式如下圖!如果你做到這一步,結果就會像圖一中間的那個車牌影像!

    一般的車牌影像到這邊應該就可以繼續後面的字元模型比對了!但是圖一的這個例子是因為拍攝距離實在太近了,所以車牌變成上寬下窄,也就是每個字的左右傾倒程度不一樣!靠近攝影機的字元比較直,較遠的字就會以不同的角度傾倒了,如果不正確校正這種誤差,也是無法正確辨識出每個字的!

    怎麼辦呢?你又怎麼知道有這種異常的狀況呢?基本上還是必須有可以分析個別字元傾倒方向的演算法!發現左右字元傾倒方向明顯不一樣時就必須啟動校正上下寬度不同的幾何辨識機制了!最終我就可以得到圖一下方非常正確的車牌子影像了!到這一步當然辨識的答案就鐵定很完美正確了!這些應該都是Google AI還不知道的技術,因為我之前沒講嘛!

    所以不要再說甚麼CNNDL比我厲害了?他們差得遠了!完全跟不上我的!Google AI說的YOLO用的點子真的就是我十年前用的舊方法!那是我三年前就已經完全淘汰不用的過時技術了!我的新方法不但不再有左右邊不準導致左右傾角度錯誤的老問題,辨識速度還更快了!你們說是誰比較AI

    回應

    限會員,要發表迴響,請先登入