Contents ...
udn網路城邦
貨櫃碼辨識真的比車牌辨識更難很多!
2025/05/22 05:05
瀏覽603
迴響0
推薦9
引用0

車牌辨識的市場需求是貨櫃碼辨識的百倍以上,但是實際上貨櫃碼的辨識難度是更高很多的!所以只有我這種不懂得如何賺錢的笨蛋才會找麻煩做這種鐵定賠錢的生意。車牌基本上是寫在一個淨空區域內的標準字元,但貨櫃碼則是遷就貨櫃起伏不定顏色各異的表面,甚至會跨越門縫門鎖等結構的噴漆字元,看看上面破碎的M字與剛好跨越一個加強結構的凸起處的5就知道了!

還好我從多年來嘗試辨識各種破爛車牌的豐富經驗中,對於這些麻煩狀況都有解方的!基本上跟我找車牌的邏輯相似,先找出排列整齊的清晰字元,再加以整理,包括拚合破碎的字元與從背景中按照貨櫃碼字串格式定位,挖出應有的缺字,參考的當然是貨櫃碼的標準格式了!

跟車牌辨識不同的是貨櫃碼可以是一橫行11碼,也可以是雙橫行47碼,也可以是一直行的11碼!字數也多於一般只有六七碼的車牌字元,所以要整理出一組貨櫃碼的程序比車牌辨識難上好幾倍!其他做車牌辨識需要的技術還一個都不能少!最終的辨識率也跟車牌辨識一樣必須逼近百分之百!開發這種東西能賺回研發投資的機會是非常渺茫的,我只當作是練功累積公司的技術資產!

其實還有一個更困難的技術是通常貨櫃集散場中拍攝的是貨櫃車全景,貨櫃車那麼大,相對的貨櫃碼就顯得很小很不明顯了!我現在有很多客戶提供的現場影像,大多數資料基於客戶對自身作業環境的隱私要求不便展示,但是可以想像會比在街景中找一塊一塊黑白分明的車牌困難很多!

跟車牌辨識還有一個不同之處是可以利用「檢核碼」來幫助辨識,如下圖有框框圍住的1就是檢核碼!這個數字是將前面TLLU802247等十個英數字經過固定公式運算出來的答案,如果前面10個字有辨識錯誤,算出來的檢核碼就會不一樣,我就知道辨識錯誤了!當然也有可能負負得正,多於一個字的錯誤碰巧也可能算出正確檢核碼的,只是機率很小而已。畢竟字元排列組合有千千萬萬種,檢核碼只有0-9的十個可能答案嘛!

如上圖中,那個4字元被磨損了,按照正常辨識程序會比較像是1而不是4,所以試算前十字的檢核碼就不是1了!這種字元汙損的機率當然不高,所以我可以假設前十字中只有一個錯誤,就檢視字元比對的符合度,找出最可疑的字元來嘗試錯誤,就是將4字的那個位置用09的數字置換計算檢核碼,就順利「猜」出那裏應該是一個4字了!

好玩吧!我想說的重點是:影像辨識應該是基於所有可靠的線索,努力找出正確答案的CSI遊戲!絕對不能只依賴甚麼機器學習或深度學習的統計猜測!雖然如上例我也是用間接資訊推測的,但是準確度可靠性當然遠勝於用一大堆模糊資料「學習」的結果!須知機器學習即使有意義也是無計可施時不得已的下下策!絕對不是甚麼好的AI策略!大家真的不要再被那些假AI繼續欺騙了!好好認真學習真正準確有效的影像辨識技術才是正途!

有誰推薦more

限會員,要發表迴響,請先登入