

這樣扭曲的車牌也能辨識正確?會不會太誇張了?一定有作弊吧?確實如此!左右兩邊的字扭曲得如此厲害,應該是無法經過正常的字模比對門檻加以確認的!把變形的E與6去比對標準字模,或許在眾多字元中E與6還是分數相對較高的?但絕對不像正常的字元那麼高!我的標準辨識程序(SOP)不會直接認定它們是E與6的!
所以拘謹的合理答案就是MG-567囉?在台灣的車牌格式中確實是有這種可能的!就是工程車了!但它們都是綠底白字或白底綠字的,而且字型一定是屬於六碼車牌的圓胖格式。可是那個清晰的6字已經露餡證實這個車牌是屬於七碼車牌了!看下面的兩種字型的6就很清楚了!左邊是六碼車牌,右邊是七碼車牌!

所以如果我不做進一步的處理,從已知的線索就知道MG-567是一個鐵定錯誤的答案!不可能有這種車牌的!那我還要報給客戶知道嗎?當然不行!通常就是直接「不起訴」處分了!軟體的回應就是:找不到(合理的)車牌,宣告此案例無法辨識了!如果那個6字是符合六碼車牌字型的6呢?那當然就回報MG-567了!至少有機會答對!你沒有其他可以否決它的證據嘛!
但是就此放棄說無法辨識畢竟心有不甘!就像警察面對有著一些不完美證據的懸案一樣,有沒有可能在之前遺漏被淘汰的資訊中,找到合理的跡象,再根據機率統計的概念「猜測」出一個最合理,可能性最高的正確車牌呢?其實這就是現在流行的機器學習與深度學習的基本概念了!他們的合理性評估標準更低!只是依據目視正確的資料答對率來猜而已!不像我會考慮所有物理原理與法規的限制來通盤考慮!
以此例來說,我已經知道它應該是一個七碼的車牌了!但是可以辨識的只有中間的5個字,從七碼車牌的規則推論,前面應該少了一個英文字,後面則是少了一個數字!所以我在預期有缺字的部分做字模比對,即使符合度未達預設標準,也考慮其中「最像的字元」是否合乎車牌格式?如果合格就盡量降低審核門檻讓它過關吧!好像降低及格分數給補考機會的概念!
我得到的兩個敗部冠軍字元就分別是前面的E與後面的6了!以台灣的七碼車牌來說,E是很常見的電動車車號,所以我就依據經驗法則,讓它加分過關了!6字也是以降低錄取分數的方式,讓它可以以低標錄取了!這樣就在合乎法規格式與經驗法則的機率統計前提下,我猜測了一個非常合理,正確機率很高的答案EMG-5676!也完全符合所有人會做的目視判斷!
當然如果更扭曲一些,目標字元連低標符合度都不夠,就是根本無法判定是甚麼字?我也只能放棄了!並不是每個這種扭曲車牌我的軟體都一定會有答案的!如果根本看不清楚亂猜,答對機率太低時,反而不如承認失敗,以免無謂增加後續管理者的困擾,就是認錯車或找不到那台車啦!
大家認為的ML、DL與CNN的優點之一,就是它們是以機率統計為基礎,只要有一點蛛絲馬跡就會有反應!不像OCR製作的專家系統那麼一翻兩瞪眼?辨識失敗就甚麼結果都沒有!其實不是那麼涇渭分明的!我的OCR就可以進化到善用所有殘餘資訊,考慮經驗法則與機率統計的概念,幫我做出更聰明,也就是更AI的辨識決定!推理過程的精緻微妙真的有如CSI辦案!
所以我的影像辨識是比ML、DL與CNN更先進的專家系統!我的OCR絕對不是過時的技術!而是優化更新之後的最先進技術!我也願意面對挑戰,以學術研究的務實精神自我剖析,也願意跟ML等技術公開交流競爭!問題是他們敢不敢跟我PK而已!因為以既有資訊來看,怎麼看都會是我贏的!