目前台灣專門經營路邊停車收費管理的幾家大公司都是使用我的車牌辨識軟體,全台灣每天這種照片的產量大概有數萬張之多!即使我的軟體辨識率已經是業界頂尖首選,這種手拍影像變數太多還是會有不少失敗案例,我常會請他們匯集給我研究,我手邊累積的這種之前版本的軟體會辨識錯誤的照片也有幾萬張之多!
這很像生病的人進醫院尋求治療,每張影像的車牌會辨識錯誤當然都事出有因,但原因千奇百怪各自不同,就像人生病的原因狀況千奇百怪一樣!我的日常工作就像大醫院的病理部門,拿這些「病例」逐一分析辨識(醫療)失敗的過程與原因!消極面是找到我既有演算法的錯誤漏洞,積極面是發展出新的演算法辨識出原本無法處理的問題!連人的眼睛都無法辨識的當然神仙也救不了,人眼勉強可辨識的就是我會努力嘗試搶救的對象了!
這個過程就很像醫學逐日進步,很多原本是絕症的病人都因為醫藥與療法的進步獲得新生!以前得到愛滋病或癌症都是等於宣判死刑!現在就增加很多治癒的機會了!我認為一個好的影像辨識軟體就應該是這樣的!就是一個很完善還會日漸進步的科學體系!重點是每一個辨識執行的環節都是明確可靠可以檢驗證明並尋求改善的!
前幾天偶然發現了一個2019年拿到忘了開箱的資料壓縮檔,這幾天拿最新版程式逐一測試,原本在2019年百分之百會辨識失敗的資料,現在的辨識正確成功率已經提升到七成以上了!就像很多原本必死的絕症病人現在七成都可以治癒出院了!這就是我天天不懈努力多年之後獲得的回報!我的「醫術」越來越好了!
相對的!現在流行的所謂AI影像辨識就完全不是這個概念!他們的邏輯是用大量影像資料以人眼辨識標記正確的車牌答案,然後讓機器學習或深度學習的數學模式去自行學習、訓練或演化出可以答對最多題目的反應模式!當然他們也可以演化出近似對症下藥的效果,對不同資料會有不同反應,但是如何反應的基礎是相對於人工標記答案對錯的經驗值,而非可以解釋的科學原理!
大家應該可以意識到這是一個效率很低的「研發」過程,也就是需要非常多的人力去標記資料,也需要極大量資料作為統計訓練的基礎,機器自行摸索學習也不可能像人腦一樣可以做有意義的科學理性甚至抽象的思考!所以研發訓練過程一定是很冗長而且緩慢的!好處是即使研發人員腦袋空空,甚至完全不懂影像辨識原理都會有進度!
最糟糕的是如果他們完成了一個不錯的版本提供給客戶後,當客戶反饋辨識失敗的案例時,他們是無法像我一樣,正確回答每個案例為何失敗的明確原因!因為詳細的辨識過程都深埋在深度學習(DL)模型的「隱藏層」(Hidden layer)裡面,連AI專家也不知道自己訓練出來的軟體是如何做處理的過程與原因?那真的是售後服務的噩夢!我就絕對無法忍受那種尷尬!實在太糗了!好像面對失控員工的老闆?
所以我還是會繼續目前穩紮穩打的研發模式,除非哪天這些AI的效能真的比我好時才會考慮改變作法的!目前他們還在追趕我的辨識能力,看不到我的車尾燈啦!
限會員,要發表迴響,請先登入