Contents ...
udn網路城邦
充分掌握「明確合理」的資訊,才是影像辨識成功的關鍵!
2026/02/22 08:57
瀏覽221
迴響0
推薦12
引用0

像上面這樣歪斜模糊的影車牌像,我也是在最近的技術持續進步之後才能辨識正確的!所謂的研發進步與努力的實質內容是甚麼呢?就是我很想讓對於影像辨識有興趣的讀者們知道的重點!

現在大多數人都被機器學習派的宣傳洗腦了!以為只要收集夠多的模糊混亂資料讓電腦「學習」或「訓練」就行了?但這實在是非常荒誕渺茫不切實際的想法!好像閉著眼睛對空中開槍,土豪說:只要子彈夠多,槍也夠多,就一定可以打中麻雀的意思一樣!不是不可能,只是成本實在太高,效率實在太低了!這樣作影像辨識是愚不可及的!

正確的方向當然是盡可能掌握明確合理的既有資訊來做推理,就像你想擊中飛鳥,最合理的方式當然是睜大眼睛看到有鳥飛過時才瞄準目標開槍!還必須計算鳥的飛行速度等等周邊資訊,讓擊中的機率極大化!成本消耗極小化!這樣才有可能在耗盡資源之前打獵成功抱鳥而歸!

如上的案例,很多個字的筆劃是模糊的,但也有少數的字元是清晰的!我的辨識技術研發就是針對如何充分利用少數的明確資訊去推理其他不清楚的模糊資訊!很像拼圖時,你必須先找出明確可靠容易辨識的部份為起點!你越能利用少數明確資訊做出合理的推測就越快可以聚焦找到剩餘的部分完成辨識!

上面就是我們找到這個車牌時第一手的破碎資訊!前兩個字是破碎又沾連的RD上半部,第三個A字也不完整,但是高度大致是對的!367完全連成一氣,0字是唯一清晰可辨認的完整字元!即使資訊如此殘缺,我們還是可以估計出字元的合理寬高,以及整個車牌的扭曲變形程度,先扭正車牌再從扭正的影像中找到每一個殘缺的字元,我的這些推理過程越正確,成功辨識的機率就越高!

所以我的研發內容就是這些資訊的推理過程與使用方式了!早期的我可能必須較多較完整的資訊才能找到正確完整的車牌答案!但是當我不斷深入研究時,就會發現越來越多的狀況下,我可以用更少的資訊就能推理出正確答案!把這些推理過程數學化與程式化之後,我的辨識軟體就顯得越來越AI了!

所以影像辨識的關鍵技術很像聰明的警察偵探辦案!能用越少的證據拼湊出正確答案就是越厲害的警探!相對的,機器學習的概念就是相反的!他們完全不鼓勵人把事情想清楚,只是鼓勵大家用電腦的計算能力做大量統計機率調整就好?基本上就是「何不食肉糜」的現代版啦!沒人說吃肉會吃不飽,只是大多數人沒那麼多錢而已!這麼作確實可以促進資訊硬體產業的榮景,但對於影像辨識產業呢?那就是一場浩劫了!

所以請大家面對現實!機器學習(或深度學習)絕對不是適合做為影像辨識主軸的技術!繼續相信這個錯誤觀念一定會讓你的研發一敗塗地一事無成的!不要繼續受騙了!影像辨識不能那麼玩的!

有誰推薦more

限會員,要發表迴響,請先登入