這是近距離車牌變形校正的魔王關卡！孔雀開屏時怎麼辦？ - 鄉下老師

Contents ...

這是近距離車牌變形校正的魔王關卡！孔雀開屏時怎麼辦？

2026/03/11 10:48

迴響0

推薦15

引用0

車牌都拍得這麼大這麼清楚了，要辨識正確還會有甚麼困難嗎？事實上就是很難！也是讓我尷尬了好多年的魔王關卡！就是在近距離高俯角拍出來的這種車牌！號稱車牌辨識達人的我，事實上也是最近才設計出比較穩定可靠的校正程序。之前的幾次嘗試都很難控制副作用，常常讓原本沒問題的影像反而被改錯了！

上圖的紅色線段是我的演算法找出來的字元中軸線，目的是要知道字元左右傾倒的程度！如果距離不要那麼近，這些中軸線應該都是近似平行的，就是車牌遠觀時每個字元的左右傾倒角度應該是非常接近的！所以當我希望得到字元不傾倒的車牌時，只要算出這幾個中軸線的平均值或中值，然後根據這個角度旋轉影像就好了！

但是如果拍攝距離那麼近呢？這些中軸線就會像孔雀開屏一樣，各自往左右不同的方向傾倒了！我根據中軸線都一樣的假設轉出來的車牌就變成下圖這個樣子了！中間的字要辨識當然沒問題，左右遠邊的字就很常出錯了！不幸的是：路邊停車管理的開單員真的常常會這樣拍照！而且以他們的觀點，真的無法理解為何太近反而無法辨識？

我也知道這已經不是影像「品質」的問題，拍照的人已經盡到責任了！接下來就應該是我這個影像辨識專家應該處理的問題了！如何讓每一個字都盡量正確地變成直立的狀態？理論上當然是可以做到的！只是需要用到的數學(幾何學)比較複雜，書上當然是沒教的！我必須自己設計發明。

上圖的問題就是出在每個字的傾倒程度應該一樣的錯誤假設，事實上就是不一樣嘛！用白話文說，就是我必須把一個實際上已經被扭曲成上寬下窄的梯形的車牌影像校正回正常的矩形！較簡單的想法，就是我可以以上圖為基礎，讓圖形在不同的Y值作不同比例的左右膨脹！最上方固定，越往下膨脹越多，如果相關參數計算夠準，夠接近事實，就會變成下圖這樣了！這樣的影像拿去比對字模當然就一定不會錯了！

其實我做車牌辨識的實務這麼多年，一直都覺得最困難，但是也最重要的關鍵技術就是這些幾何校正！但是如果你有用心去看相關的文獻與參考資料，卻會發現這部分的研究討論卻是非常非常少的！所以我在研究車牌辨識之初就看準這是一個既有技術上的大缺口！大家都沒有認真面對處理，如果我做得特別好就是優勢了！事實發展果然也是如此！我就是以歪斜變形車牌辨識的技術好而揚名立萬的！

在簡單的2D資料如文件掃描影像，要得到端正到可以跟預設字模比對的影像，你只需要作：平移、縮放與旋轉三個動作！但是要辨識出用手機或攝影機在3D立體世界拍出來的影像中的目標就沒這麼簡單了！正常的矩形車牌可以變成幾乎任何形狀的四邊形！如果你沒有針對性的數學作好每種狀況的幾何校正，就只能看得到吃不到了！知道它是個車牌卻說不出它的車號！

所以很多已有傳統的OCR辨識技術的公司，想進化到辨識攝影機拍的立體空間影像中的目標，最大的技術關卡就是幾何校正！不轉正就是無法比對模型確認辨識結果！我們做影像辨識專案時主要的價差也是看需不需要做立體變形處理的！掃描閱卷辨識的價位較低，手機拍攝考卷的辨識呢？至少是兩倍的價錢！

但是很微妙的！號稱最先進，最AI的ML、DL與CNN等技術對此也是含糊其詞裝瞎的！所以Yolo老是在炫耀他們在複雜背景中「找到車牌」的能力，但是最終的車牌辨識率卻常常避而不談！他們也會談光線昏暗或字元模糊時的辨識，但就是不願深入探討幾何校正處理這一部份！車牌一歪斜變形好像就不關他們的事了？

所以啦！全台灣的車牌辨識應用，只要是手拍的辨識情境，想買辨識軟體你只有一個選擇！就是逸中軟體的車牌辨識啦！你可以去業界打聽，真的沒有足以跟我競爭的產品！我沒有甚麼厲害的AI密技，就是花很多年研究立體世界中物件影像的幾何學而已！