Contents ...
udn網路城邦
即使只有一條直線我也相信它是一個7字!你也會同意的!
2025/12/29 04:22
瀏覽39
迴響0
推薦0
引用0

這應該是一個誇張的貼紙雜訊造成的極端案例,其實任何人稍微看清楚之後,都不會覺得第三個字是1!而且很確定應該原本是個7!但如果根據正常字模比對的邏輯它只能是個1!面對這種情況,如果你希望自己的車牌辨識聰明到可以做出跟一般人一樣的正確判斷,你就必須問:人的腦袋對此「認知」過程的邏輯或「證據」是甚麼?如果每個人都會做出一樣的判斷,這中間的邏輯推理一定是很明確甚至一致的!我只要把它寫成程式我的軟體就很AI了

我從我的辨識過程圖中得到了我的推理答案!就是當車牌做過幾何校正之後,那根如果是1就應該很垂直的直線還是歪斜的!且歪斜程度與前面的7字幾乎一樣!所以即使7字的頭部被完全遮蔽消失了!剩下的部分還是可以證實完全不可能是1!只可能是破碎的7!我也據此邏輯判斷它應該是個7

這跟賭神電影裡,只看到紙牌字元的一個角落,就可以判斷是甚麼英數字的意思是一樣的!但是這個邏輯推理過程卻不在正常的OCR辨識過程之中,所以必須在我們確實理解掌握人腦的思考過程後才能寫程式,變成我的AI影像辨識軟體的一部份!

這就是我始終明確追求的影像辨識理念與做法了!要讓AI這麼聰明,就是除了SOP之外,必須有很多不太耗時的自我檢測機制,也就是要能看到關鍵的特徵現象,在影像本身並不完整時,你從需要字體完整才能正確辨識的字模比對中得到的答案常常是錯的!但是一個片段的關鍵特徵就可以幫你確認是另一個字了!人就是那麼思考的!如果你的AI做不到?那就是不夠AI了!

所以我們從小學習認書本上的印刷字要很多年,要認得所有人手寫的字還需要更多年!其實就是在腦中逐步建立各種特徵經驗!正如我現在每天用很多各式各樣不是很正常的車牌影像做研究調整,想讓我的車牌辨識軟體更聰明一樣!這就是我認為合理的高準確度影像辨識軟體應有的研究方式!

在我的觀點,目前多數人想用機器學習或深度學習做好影像辨識好像緣木求魚?幾乎是不可能的!這些「小聰明」的累積就是人類視覺的本體,其實並不簡單,也不可能依賴機器學習自動精準地學會!用資料統計回歸確實可以很快呈現「大概」的智慧能力樣貌!但是要精準穩定絕對還是要靠針對性演算法的!

信不信由你!反正我以此理念做了十年的影像辨識效果都一直很好!甚至遠比機器學習或深度學團隊的成效更好!如果深度學習不能證明自己,我當然不必替他吹噓抬轎!我只是告訴你我知道的事實而已。


限會員,要發表迴響,請先登入