如上的髒污模糊車牌,回到幾年前我的軟體是無法辨識直接放棄的!就像我最愛看的警匪偵探影集(CSI等等),有些罪案會因為證據不足無法立即找到兇手,就變成懸案了!但是隨著科技的進步與更多的周邊證據的浮現,很多懸案只要警方肯認真追查下去,抽絲剝繭加上邏輯推理等等努力還是很可能偵破懸案的!
我認為AI影像辨識就應該是這樣的!影像來自真實的物體,只是經過攝影變成實物的摘要剪影,所以很多資訊會遺失(沒拍到)或變形(歪斜角度拍攝)!但是只要你能仔細搜索影像中的所有資訊,充分運用物理觀念解讀,並整合參考影像之外的與此實物相關的資訊,像是車牌應有的標準格式與樣貌(尺寸比例)等等,很多原本難以辨識的車牌就會有解了!這就是我每天做的工作,不斷檢視研究之前無法辨識的懸案!
譬如上例,因為我是用OCR技術為基礎,實際上第一時間可以正確切割的字元只有四個(H152)!而且H是與車牌的”-”號格線相連而變形的,使用H的標準字模比對一定是會失敗(很不像)的!以我早期簡陋的辨識程序當然是因為資料殘缺謬誤變成懸案了!
但是從已知的四個字元目標的排列方式,已經足以算出車牌的傾斜變形參數,我可以如上圖右下方將車牌附近的影像作幾何校正變成如同正面直視的車牌了!在此基礎上我可以用字元間隔資訊知道5與2之間還有個遺失的字元,如果多數正常車牌應有六或七個字,我也可以猜測前方也有缺字!所以我可以用類似CNN的矩陣搜尋技巧找到遺漏的2與1兩個字元!
但是因為H字元與隔線沾連多了一個尾巴,也因此改變了字元間距,所以我不但無法直接辨識出正確的H,同時也無法從較大的字元間隔距離知道這個六碼車牌是2-4、3-3或4-2的格式?怎麼辦呢?就像你身體不適到醫院看病,醫生也不是神仙一眼就可以確定你的病因病灶,所以就會安排可能的檢驗,如驗血驗尿或照超音波、X光或斷層掃描之類的,有了更多的資訊醫生就可以做出正確的診斷了!
當我發現H辨識度很差時就檢驗它的形狀,發現它比其他字寬一點,那就繼續檢驗它的異常部位,發現它右側有顆腫瘤,切掉腫瘤之後就很確定可以辨識出是個H了!同時間,事出必有因嘛!影像來自真實物體,如果未經變造,那顆腫瘤不會無端出現的,最合理的解釋就是它是每個車牌都有的短隔線!所以正確答案一定是:2H-1512了!
這就是我的車牌辨識軟體會做的複雜檢驗與推理,每個個案都會有不同的狀況,如果標準的SOP無法辨識,就會啟動很多針對可能問題的副流程,非常像警方辦案的CSI流程,如做指紋辨識或檢驗DNA或檢視監視影像等等。也很像大醫院有非常多科別部門可以正確診斷與醫治不同的病症!
當然隨著這個精密儀器越來越聰明,各種例外處理程序就會越多越複雜,我的研究維護工作也就會越多!所以我的任何軟體都不會是資料訓練完畢就沒事只管拿去賣了?而是會持續研究進步的!除了繼續研究解決更多懸案之外,客戶在線上使用時也會回饋新的無法辨識或辨識錯誤的案例,我是隨時待命做售後服務的!任何錯誤即使當下無法解決,也一定可以跟客戶解釋失敗的原因!客戶就可以改善環境避免產生解不開的炸彈了!
這就是我認為AI影像辨識應有的風貌,也認真這樣實作了十年開發出很多產品!我的每一種影像辨識產品都是堅持這種理念,不只充分取得影像資訊,也充分使用物理科學去分析理解,還會參考與目標相關的法規與規則,一步一步踏實研究建構出來的!跟現在流行使用ML、DL與CNN等統計學技術理念製作的AI影像辨識是從裡到外都完全不同的東西!
剛開始因為他們已經搶先霸佔了「AI」的制高點,讓我非常困擾,我知道如果要談「智慧」的深度與合理性,他們只用因果關係統計歸納出來的「智慧」只是如同無知者的經驗累積而已!他們和我的比較非常類似:沒讀過書的老師傅,與真正有博士學位懂得科學,也用科學方法態度嚴謹做事的科學家!
AI的意義是Artificial Intelligence,就是人工「智慧」!如果不知其所以然的經驗也可以稱為「智慧」?那我處處根據科學知識與技術建構的軟體反而不能(或覺得不好意思)自稱「智慧」?那真的是太荒謬,也太離譜了!他們(機器學習派)真的是徹底拉低了智慧的意義與解讀標準!所以我也開始毫不客氣地自稱自家產品是AI影像辨識了!
而且我還要自信且大聲的說:「我是比ML、DL與CNN使用者更AI的AI影像辨識專家!」我相信最終科學、歷史與事實證據都會站在我的這一邊!我不是說我一定是最厲害的專家,但我相信我走的路才是最合理可靠的方向!幾年之後大家都會支持我,認同我的理念的!
機器學習派的AI影像辨識還有個最迷惑人心的大謊言!就是辨識能力會隨著資料累積而進步?事實是使用經驗法則訓練的模型無法對症下藥準確處理個別差異的狀況,而是與答對率最高的統計原則妥協的結果,好像是做出一個盡量可以治百病的單一藥方,到了一個程度就會達到高原區,資料再怎麼增加辨識率都不會繼續提高了!因為任何新的調整都會有利有弊辨識率增減互相抵銷的!
但我的理念就是完全對症下藥來辨識所有狀況的影像!已經對的案例就永遠還是會保持正確,基於錯誤狀況增修新的例外程序後,該狀況就也能永遠穩定成功辨識!沒有影像會吃錯藥!他們的方法就是任何影像都吃一樣的藥!你猜會發生甚麼事?所以我的方法才是保證一定可以越來越好,辨識率絕對能穩定進步!這一點也是他們搶先掠奪了我的AI優點台詞!我才是真正可以保證辨識軟體越來越好的人!他們不是!