Contents ...
udn網路城邦
辨識微小的色差時,電腦比人厲害!別以為它一定不行!
2025/12/03 03:19
瀏覽299
迴響0
推薦9
引用0

說到影像辨識,最厲害的工具利器應該還是人的眼睛加上大腦!所以機器學習等技術都還是以人的判斷作為標準答案去訓練的!但是畢竟數位影像與人腦中處理的影像本質不同,人腦與電腦的計算過程方式也不盡相同,所以某些方面還是強弱互見,電腦也有優於人眼的時候!

我最常碰到的這類情況,就是某些目標影像很暗,或是說字元與背景的對比度(或色差)很小的時候!如上案例中的L字元,第一時間一般人眼是幾乎看不到的!但是如果用數位影像的方式去分析,L的字元與背景之間還是有大約256灰階模式中的10個灰階那麼大的差異,對於辨識軟體來說,仍是可以穩定辨識出來的「清晰」目標!

所以很多客戶看到環境太暗時,怕辨識系統辨識不到,都會急於增加照明補光,或是在攝影機端就做硬體的影像處理,像是使用紅外線(夜間灰階)模式或自動增益(AGC)等等。但是增加照明設備很花錢的!紅外線模式會降低解析度,且讓計程車的紅字車牌幾乎無法辨識;自動增益則會放大背景雜訊,讓辨識更容易失敗!

所以我常常都會提醒客戶,辨識環境影像偏暗,甚至有車燈炫光時,不必急著做自作聰明的處置,先讓我的辨識軟體直接辨識看看!也就是保持原始影像的數位資訊,讓我在辨識演算法上想辦法,常常根本不需要補光或改變攝影機的設定就可以穩定辨識了!

以我的經驗,人的眼睛可以分辨的灰階精度大概是64階(甚至只有32階),更小的色差就看不出差異了!所以一般人眼才會看不清楚那個若隱若現的L嘛!但是對於數位影像處理來說,差十個灰階是很明顯可辨識的範圍,剛好凸顯了電腦影像辨識與人眼辨識的差異。

這也是我常常強調的:必須把影像辨識當一個物理問題來看待的觀念!不要迷信甚麼深度學習的數學模式就可以自動「學習」出很聰明精準的智慧?這種荒誕離奇的事情根本不曾發生過!你看到的所有聰明的AI辨識,一定都是精準研究理解與掌握影像的物理事實之後設計出來的針對性演算法的效果!

如果你相信機器學習、深度學習或類神經網路會有神效,自動產生比你更聰明的AI影像辨識成果?不僅一定會大失所望,還會浪費非常多的錢與時間卻一無所獲!那絕對是一場災難!

有誰推薦more

限會員,要發表迴響,請先登入