Contents ...
udn網路城邦
即使被扭曲成這樣,我還是可以判斷它一定是1!
2026/01/05 08:23
瀏覽387
迴響0
推薦15
引用0

車牌本身被折彎當然不在我的辨識SOP考慮之內!能處理原本矩形的車牌在不同視角產生的歪斜變形,已經是非常困難的演算法大工程了!車牌會如何被彎折呢?那是更沒有規律的隨機變化,我還沒這麼厲害的!所以這個彎曲的1字原本會被我的SOP辨識成4

但是我們知道數字1與英文字I有個特徵是所有其他英數字都沒有的!那就是他們自上而下每個垂直高度位置的寬度都很窄!即使軸心被扭曲了也大概是這樣的!除非被彎折到接近90度!那就算是例外中的例外就算了吧!所以檢驗字元目標每個Y值位置的最大寬度,如果發現它就是比其他字元的寬度窄很多,那就一定是1或I了!

而台灣的七碼車牌是說好了一定不會用I字的!所以這個彎曲的蛇蠍美女就一定是1了!這就是我用「常識」解決影像辨識問題的一個範例!看起來不是很有數學的美感,但絕對是我們的腦袋也一定會使用的邏輯!所以我們的眼睛大腦絕對不可能說那個字是4!我只是想到了它不是4而是1的一個特徵理由!

我認為這些點點滴滴的小常識堆積出來的架構就是人的視覺智慧了!絕對不可能是很優美單純的幾個數學公式而已!它的雜亂與瑣碎性質是一定存在的!要做出跟人的視覺智慧相似的影像辨識軟體,也就一定不能自我設限在必須優美完整一體成形的理想架構之中!

如果你放任資料與粗略的模型去自行磨合?就是所謂的深度學習了!而且還期望這個過程可以自動產生類似上面這種能處理例外狀況的智慧?簡單說就是:你想得美了!不可能的!緣木求魚的成功機會都比較大!但是用我的作法呢?我的辨識軟體得到的答案就會與一般人的判斷非常相似!

所以之前有人說:科技始終來自人性!至少我的影像辨識軟體就是走這個大方向的!而且就是靠大家都可以掌握理解的明確影像處理程序逐步做出來的!絕對不是像機器學習或深度學習那樣,希望電腦自動統計攪拌之後就可以自動產生很棒的智慧?這種事以前不曾出現,以後也不會發生!

有誰推薦more

限會員,要發表迴響,請先登入