Contents ...
udn網路城邦
新加坡車牌的模糊辨識能力也不差了!
2026/06/11 11:01
瀏覽88
迴響0
推薦5
引用0

我的車牌辨識研究可以說一直是追著人眼的識別能力在跑的!早期的關注點就是歪斜變形的車牌!我發現傳統的車牌辨識論文內容幾乎都是很不重視幾何校正過程的!即使說有校正傾斜也只是極簡單的旋轉縮放而已!但是在實務上車牌是在3D立體空間存在的,隨便一個角度就會變成任意四邊形,所以視角稍微偏差到十幾度以上,多數的車牌辨識系統就投降了!

所以我第一階段的研發就是發明出完全超越傳統的車牌鎖定邏輯!完全拋棄車牌是矩形框的假設!用個別字元目標的空間排列組合建構我的車牌區域,沒有預設的形狀,所以我的歪斜變形處理能力可以說是直接顛覆了市場!至今純手拍的歪斜變形度最高的路邊停車開單的應用場域,我幾乎是獨佔的狀況。

也就是說我很早就追上了人眼對歪斜車牌辨識的能力!大概人眼可以辨識的歪斜變形程度都難不倒我的車牌辨識軟體了!接下來的挑戰其實更困難,就是人眼對模糊目標的理解能力實在比電腦辨識軟體強太多了!理論上要辨識模糊的車牌目標似乎只能選擇類神經網路(CNN),模糊就是邊界不清楚,字元無法明確切割,當然就組織不出車牌了!CNN則是只問特徵與形狀,不看目標邊界的!

但是我這些年還是堅持以OCR的架構為基礎匍匐前進,原因就是直接使用CNN的計算量代價實在太高了!高到原本可以用OCR快速辨識的案例都要多出數十倍的計算量,如果不用昂貴的GPU電腦就根本無法運作了!即使我這麼作了,我的軟體變成必須使用高貴的GPU電腦,我的低成本優勢就蕩然無存了!而且CNN也沒有我的歪斜變形的辨識能力,我不會因此就自廢武功的!

我的基本方向是盡量使用OCR獲得的不完美資訊,利用目標切割或融合重組的方式得到正確的字元,如果是預計應有字元處根本沒有可參考的目標,就是字元完全與背景相連時,那就啟動局部小區域的CNN地毯式搜索,這樣計算量增加就極為有限!但是還是可以像CNN一樣擁有抓出模糊目標的能力!那就是兩全其美了!利用了CNN的優點,卻完全不必放棄我所有的優勢!

如上的新加坡車牌就是一個蠻極端的案例!車牌字元因為失焦相當模糊,用OCR辨識目標時只能說隱約有一排字被發現了!接下來就是用少數的資訊估計字元可能的大小,判斷是兩字沾連或三字沾連就按比例找到理想的切割點做切割!結果通常也能得到正確答案!換言之,我的新加坡車牌辨識軟體的模糊辨識能力也不差了!

有誰推薦more

限會員,要發表迴響,請先登入