
在影像辨識的應用中,機器學習(ML)、深度學習(DL)與類神經網路(CNN)的一大盲點是:用來訓練模型的資料,與你之後要辨識的資料因果關係未必相同!譬如上例,你從不同影像中收集到很多樣貌特徵不一樣的T,如果這些T的影像都來自非常類似甚至相同的拍攝情境,差異只是來自隨機的背景誤差,那麼這個訓練(統計)的模型用來辨識「具有同樣拍攝條件」的影像中的T就有意義!
但事實上我們需要的當然「不是」這樣的模型與應用目的!我們希望訓練出來的模型是可以辨識出很多不同拍攝條件下出現的T!但是如果你用大量傾斜度0-45度不等的各種樣貌的T影像加以訓練,會導出甚麼樣的怪模型?那個模型真的可以把0-45度傾斜的各種T影像都正確辨識出來嗎?如果你相信這種鬼話,你的認知功能已經病入膏肓了!
這篇論文出現於2000年,顯然那個時候很多人真的天真到以為這樣行得通?所以這樣的論文居然可以在台大電機系的研究所被審核通過?現在的類似論文就比較務實了!在自然影像中擷取到可能的歪斜車牌影像後,一定會有一個較完整的車牌影像幾何校正的過程,之後才會進入到字元辨識的過程!
也就是說,我們必須面對車牌字元影像之所以不同的因果關係!我們必須根據物理原理,從被鎖定的車牌影像中找出傾斜變形的量化指標,再明確的根據幾何學原理將影像校正到近似正面直視的車牌樣貌!這是一個科學推理的過程!ML、DL與CNN等技術都無能為力的!資料統計訓練在此過程中毫無意義也毫無用處!
十年前我就按照自己的物理觀念做幾何校正了!所以我的車牌辨識在歪斜變形辨識的能力上表現很好,遠勝於那些崇尚ML、DL與CNN的車牌辨識團隊!他們根本無法直接以資料訓練的方式解決這個因果關係其實不同的問題!這是學理上就可以證明辦不到,一般人用常識稍微深入思考也知道辦不到的事!但就是被AI迷思誤導炒作了很多年!用0-45度傾斜的一大堆T影像,當然只會訓練出一團甚麼都無法確定不知所云的濃霧模型!
事實上,即使是現在還在高喊ML、DL與CNN的研究團隊,也開始必須使用其實無關ML、DL與CNN技術的幾何校正演算法解決歪斜變形的問題了!就是在晚了幾年之後,他們被迫跟著我做完全一樣的事情而已!但是至今這個資料訓練的迷思盲點都還在迷惑欺騙著很多人!還是有標榜AI影像辨識的公司在高唱「萬物皆可辨,只要先訓練」!你還在迷信這種資料訓練萬能說嗎?
限會員,要發表迴響,請先登入





