Contents ...
udn網路城邦
車牌不是很清晰時,知道正確的格式是很重要的!
2023/12/19 08:27
瀏覽438
迴響0
推薦7
引用0

車牌多半是英數字交錯組合成的!理論上如果字元永遠都很清晰,當然就不會認錯,但真實世界不會那麼完美,所以如上影像稍微昏暗失焦模糊時,你即使有電腦幫忙也會常常無法準確地分辨其中的英文字I與數字1的!此時車牌的格式規則就是我們可以攀扶的唯一浮木了!

如上印尼車牌格式的說明,前面最多只會有兩個英文字,只有一個也可以的,三個以上就不合法了!所以我可以用程式強制第三個字必須是數字!即使從影像資訊辨識的結果說它是英文字I?我也會把它改成形狀最接近的數字1了!所以我是用非影像資訊的外部規則凌駕覆寫了純粹用影像資訊辨識的結果!但卻是完全合理且必要的動作,不然就會得到一個鐵定錯誤的車牌答案了!如果我不知道目標是印尼的車牌,我是不可能辨識正確的!

在倒數第二個字,我們再次碰到不確定是I1的狀況?根據規則,最後的英文字一碼道三碼皆可,說它們是IN1N都是合格的答案;但是另一條規則說中間的數字最多只能是四碼!如果第三個字我已經確認是數字1了,那1325就已經達到四碼數字的極限,下一個字就一定是英文字I,而非數字1了!我又再次用外部資訊否決了純「影像」辨識的結果!

好玩嗎?所以我常說影像辨識絕對不只是處理影像資料而已!這是一個綜合所有可用資訊,完整「理解」待辨識目標的過程!期待有個不必自己傷腦筋,只需要餵足夠的影像資料給電腦,讓電腦自己「學習」,就能完成複雜辨識的想法實在太天真,也太荒謬了!事實上也從未發生過!

影像辨識絕對不只是一種如何玩「影像」資料的技術!要將如上的這些外部規則與辨識流程結合,除了把上面的推理探案過程充分理解並寫成對應的演算程式,沒有其他更好的方法!你或許可以設計複雜的模型讓電腦自己從資料中「學習」,但那是脫了褲子放屁,沒必要的,直接把規則判斷寫進程式快多了!

這種合乎邏輯的複雜判斷程序就是所謂「專家系統AI的標準做法!任何實務上需要的影像辨識軟體,永遠都需要很多這種外部資訊與影像資訊密切合作,才可能達到極高的精確度與合理性!這就是大多數的AI工作都不能只靠機器學習就能搞定的實況!想做影像辨識這一行的人不可不知!

正如前幾天談過的鋼胚刻字辨識,昨天與客戶溝通時,他們給我的影像如下圖非常黯淡模糊!我就問他們需要辨識的這些字組有沒有明確的字型與排列規則?如果沒有的話,我也不敢接案的!如果有,我就可以根據部分可辨識字元推算模糊目標的位置,看到影子就開槍,猜對的機率還是很高的!

但是使用機器學習為基調的研發團隊,通常都會太相信只要影像資料夠多就可以學會辨識很模糊的目標!也很難用簡單的方式做先期的測試評估,必須真的投入大資本取得巨量資料,還要設計模型跑上好長時間(可能是幾個月)之後才知道辨識率可以達到多高?等到發現無法達到客戶需要的辨識率時,錢都已經花下去了,當然不肯退錢,大家就必須到法院見了!這幾乎已是用ML作影像辨識必然的結果!

我們公司就不是這麼做生意的!只要客戶提供幾十張需要辨識的影像,以及想要達到的辨識率,我們幾天之內就可以準確分析評估預期成品的辨識率!做不到要求的案子當然連報價都不必了!會報價的案子就絕對可以完成,我們也可以相當精準的估計成本與時程,不會賠錢的!所以我們接案的成功率與滿意度一向都是百分百完美,賓主盡歡毫無爭議的!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入