Contents ...
udn網路城邦
高俯視角的車牌影像如何修正?我告訴你!
2026/04/10 14:07
瀏覽61
迴響0
推薦0
引用0

如何將各式各樣歪斜變形的車牌影像,作精準的幾何校正,變成端正可以準確比對字模的正規化影像?這是我在車牌辨識技術上著力最深,也是最出類拔萃的技術!當然這是一個漫長的研發改進的故事,時間長達十年以上!到現在都還不斷微調甚至嘗試使用更新穎的演算法!

最初也是最幼稚的想法是直接找出車牌的邊框,但是台灣的車牌本身並沒有可以直接辨識的邊框,碰到白車上的白色車牌就完全沒得辨識了!所以這只是完全無法實作,胎死腹中的幻想而已!我的第一個與眾不同(當時)的突破是直接辨識個別字元目標,然後將字元目標排列群組成車牌目標!完全拋棄所有論文都在用的搜尋整個車牌的演算法!好像繞了一點路?但是給了我非常大的資料處理彈性!所以非常模糊歪斜的車牌我都不太會遺漏!

接下來就是找字元群組的四邊切線,但是上下切線不難鎖定,很多個字可以參考嘛!左右切線就麻煩了!只能從一個字元目標來決定!因為字元可能會左右傾倒,而且每個字元的左右邊線與中軸線未必相同,如:AFJLPTVY47等等!如果照著A字元的左邊切線當作整個車牌的左邊切線當然就錯了!車牌的左切線應該是平行於A字元的中軸線而非左切線!

但如何設計出一個面對任何英數字字元都可以正確找出其中軸線的演算法?是我這些年研究時間最長的一個困難問題!歷年來實驗過的版本多到我的垃圾桶都放不下了!直到最近才做出讓自己滿意的版本,如上圖字元上的短紅線就是目前版本的成果。

所以我目前的幾何校正程序不怕跟大家說清楚,就是以找到的車牌上下切線為基礎,先將車牌旋轉到上緣水平的狀態!然後依照每個字的中軸線平均的指向來調整字元左右傾倒的程度!但是碰到如上圖高俯角時,這些中軸線不會傾向互相平行,而是呈扇形展開!用平均值校正只能使中間的字元變端正,左右邊還是歪的!

所以如果不修正這個額外的變形時,左右的字元就會向外傾倒,也導致字元容易辨識錯誤,如圖的M就被誤認為N了!如何修正呢?就是找出所有字元上中心點的間距與下中心點的間距,上面較寬下面較窄,算出比例將梯形轉成上下等寬的矩形就好了!字元不會異常傾倒了,辨識當然就正確了!

內行的看到這裡就知道,如果我還是教授需要量產論文來升等拿計畫,題材會多到寫不完的!而且我的研究絕對不只是合乎學術規格而已!我的研發目標都是作出市場上頂尖的優質影像辨識產品!都是真的能用好用比別家產品優秀突出之後我才會說出來的!我在此的發表其實比SCI論文更有價值意義!

我也希望對影像辨識有興趣的後進可以參考我的努力過程,我想告訴大家AI絕對不是甚麼神祕的魔法!而是踏實的點滴努力累積的踏實科技成果!如果總是妄想不傷腦筋,只要拿到很多資料,照著一些數學模式讓機器自己學習?就可以產生神奇優質的AI影像辨識?那你只會浪費生命耗盡資產最後一無所獲而已!機器學習當然有用!但是在影像辨識領域它們只是可以快速切入的粗糙手段,絕對不是可以登峰造極的利器


限會員,要發表迴響,請先登入