我的車牌辨識做得很好,對於歪斜變形的辨識能力在台灣沒有比我更好的市售產品,這是毫無疑問的事實!隨時歡迎不服氣的廠商或學術研究團隊來踢館挑戰我的說法!而且我完全無意隱藏我的關鍵技術!上面這張圖就已經充分說明了我可以做到高度歪斜辨識的精要,一看就懂!其他我沒說的部份都只是執行此流程的細節而已。
稍微接觸過影像辨識的人都看得出來,上圖就是非常傳統基礎的OCR辨識流程:全彩→灰階→二值化→輪廓化(切割目標)→鎖定字元群組(車牌目標區)→幾何投影校正車牌影像,最終獲得近似車牌正面拍攝的影像的過程!到這個階段之後就是更基礎的字元模板辨識了!你下載網路上的免費OCR軟體都可以辨識正確的!
我的技術與其他技術比較,差別只是我找到車牌位置的方式不拘泥於車牌是個概略矩形的假設,我盡量將個別字元獨立切割出來,然後嘗試將它們以相鄰緊密排列但不限傾斜角的原則群組起來,再嘗試找到這個群組區域的四邊或四角,接下來就是一個逆向的任意變形處理,把歪斜的車牌扭正了!如下圖是在高雄應用科大辦的2015光電與通訊工程應用研討會上發表的圖,跟上圖意義是完全一樣的!只是當時還做不到現在那麼極端的角度。
這是一個非常直覺,也完全合乎物理科學原理的程序,我會花很多年研發,主要是致力於如何實現上述程序想法的實作細節,且不斷優化精進改善容忍度與執行效能!但基本的理念從十年前開始發想至今都沒改變過!我一直相信科學,也一直相信人類視覺的直覺反應必有道理,一定可以找到能夠數學化的邏輯寫成程式!十年過程中我始終沒有對此信念失望,一路順暢至今!
但是很遺憾的,我和我的徒弟RD好像在深山閉關修練的武林高手,多年之後武功是練成了,但是赫然發現外面的世界早就改朝換代了?現在我們使用的基礎技術似乎被冷藏冰凍甚至瀕臨被淘汰的邊緣了?左顧右盼根本沒有人像我們一樣繼續堅持用類似的傳統思考邏輯做影像辨識了?好像地球已經被某種外星人佔據了?大家都說外星語言,不再說人話了?
弔詭的是:我們的這套方法理念在所有我們想做的影像辨識上依舊完全可用!表現還比那些「外星AI」科技更好!所以我的公司才能活得好好的!好像傳統的柑仔店擠身在大都會市區中心的一堆摩登連鎖超商之中,但是居然沒被淘汰?反而生意更好?這是非常奇妙有趣的情況!既然我的做法還是很有效,就繼續享受千山我獨行的快樂寫意吧!
只是很感慨,好像全台灣(全世界?)只剩下我和我的RD繼續這樣走著傳統影像辨識之路?我們發明的這套其實很好用很合理也很合乎所有人直覺的技術,剛剛被發明似乎就已註定會失傳了?我們有可能讓AI影像辨識的潮流逆轉?讓大家開始「不用」ML、DL與CNN做影像辨識嗎?不太可能!這兩種背道而馳的技術理念又是很難相容並蓄的!所以這些技術大概就是會跟著我們退休而消失了!
所以大家看我們的作品時就當作是欣賞神奇難以重現的古蹟,像是金字塔吧?我們就像是穿越時空的古人,用傳統技術做出比大家使用的流行AI科技更好更AI產品的特殊商家,甚至算是藝術家了!金字塔怎麼作的?埃及古人沒說清楚,但是我會把我們做的事都說清楚!趁著還看得到時就趕快欣賞拍照打卡做紀念,以後很可能想Google都找不到了!因為被ML、DL與CNN資料的大數據徹底淹沒了嘛!
限會員,要發表迴響,請先登入