

我確實是用OCR技術做車牌辨識的!但是我的OCR其實已經是極為精緻複雜的進化版!我能夠辨識非常多傳統上認為OCR很難,或根本無法辨識的案例,原因就是OCR影像辨識處理的每一個步驟我都有很多的創新!當然其中很多部分都有我的徒弟RD李美億的貢獻!譬如特徵字模的設計與比對方式就是她的發明!也成為她的碩士論文主體。
大家最有感受的部分當然是我可以辨識歪斜變形車牌的神奇幾何校正技術!但大家看不到的最關鍵步驟,也就是幕後的無名英雄,其實是多樣化的二值化策略!二值化是OCR過程中能否「盡量」正確切割出所需目標的步驟,切割不完美的部分才用後續的目標融合或再度切割等修補技術加以整理達到最後的正確辨識結果!
所以如果二值化步驟可以盡量接近正確的目標切割,後續步驟就會很快很簡單。反之,巧婦難為無米之炊,如果辨識需要的字元目標根本切割不出來,再精緻複雜的後續步驟都無用武之地了!所以我的二值化其實不是單一的SOP!而是有至少五種各有特色的不同設計!簡單說就是:A方案不行或不好就換B方案,可以一直換到E方案的意思!
如上圖,簡易就是單一門檻的二值化,動態就是根據目標附近的亮度動態調整門檻,低門檻就是偏向只信任特別黑的部分,銳利化就是在灰階圖階段做有方向性的對比強化,之後再做動態二值化!清晰的車牌目標最多用到B方案就破案了!較模糊的案例就要靠CDE方案才能破案了!上例就是到C方案才成功的!
所以任何AI研發的成功都絕對不是靠運氣的!也不可能只靠財大氣粗,算力充足就無往不利的!至少以我熟悉的影像辨識來說,豐富的專業領域知識與合理精準的邏輯思考絕對還是AI研發的核心關鍵!如果你迷信機器學習的不知而行的理念,就是不肯踏實理解問題呢?你的苦日子才剛開始,而且會持續非常非常的久!
