Contents ...
udn網路城邦
辨識時間差六倍的原因說給你聽!
2022/07/04 07:22
瀏覽780
迴響0
推薦7
引用0

上面是兩張在同一個環境下拍攝的照片,也都正確辨識出車牌了!但是細看辨識使用的時間分別是:2591784毫秒,也就是後者花了近七倍的時間才辨識成功!為何如此?這是一個值得研究影像辨識的AI問題者深思的問題?

現在膚淺的AI廣告其實都很刻意地誤導大家:影像辨識都一定有個「標準解答」!他們希望大家相信:AI影像辨識就是「一個」可以直接鎖定標準答案的解答方式!但是真實世界根本不是這樣的!當目標不是絕對清晰時,任何影像辨識的方法,一定不是完美對應到唯一解答的!一定會有個符合度的分數!我們確認答案的方式只是及格分數達標了,就說答案是多少而已。

但是你可以思考一下,是不是如果目標模糊到一個程度時,兩個人的眼睛都會讀出不同的答案?任何影像辨識的方法流程也是一樣的!不會有任何單一的辨識流程與參數組合,可以直接確定那個解決方案就「保證」答案絕對是對的!此時你會不會嘗試用多種方式辨識?看看哪一種方式分數較高呢?一定會的!看某個東西看不清楚時,誰都會瞇眼歪頭試著用不同方式找到更確定答案的!這就是人的智慧!如果AI不是這樣運作?那我就不知道AI是甚麼了?

簡單說,即使是AI科技也不是表示他們可以找到絕對唯一的解答方式!如果你相信如此,你不是科學概念不夠正確,就是被AI詐騙集團騙了!

當你看到如上的漂亮圖畫時,請不要立即就相信他們已經找到唯一正確的AI影像辨識流程!就像我喜歡看的電影「魔球」中,男主角小布對著自以為是的球探說的經典對話:「你們以為自己擁有無所不知的水晶球?但其實你們根本沒有!You just don’t! 我當然沒有那顆無所不能的神奇影像辨識水晶球,但是CNN與ML專家們也都一樣沒有!每個研究者都必須踏實的面對事實做合理的研究與論述。

換言之,這些CNN演算法跟我的演算法一樣,只是盡量求解的一種方式而已,因為目標答案其實可能很複雜,如上圖的車牌799-AK那麼汙損模糊,需要多種解法(不同的參數組合)才能涵蓋解答夠多的狀況,找到最可能正確的答案。

很現實的事實是:畫出上面這些CNN圖解的任何一個專家,都沒有做出過比我更好的車牌辨識核心!如果我也想迷惑眾生,我也可以將我的演算法畫出很多類似的迷幻示意圖!而且我有具體的成功案例可以對應說明,他們其實沒有!但我的生意不是靠著騙人來做的,我盡量不要這樣騙人,要寫就寫大家確定可以模仿實作的書!我也真的寫了!

所以回到主題,為什麼我的兩個同場域辨識範例會有那麼大的時間差呢?看下面這個我的實驗程式的介面你就知道了!

我辨識一個車牌時,其實不只是正負片都會辨識,同樣是正或負片辨識,都還有高達五種的辨識流程!就是假設畫面很亮或很暗或字元可能破碎?我會假設不同環境,設計出最有利於辨識那種特殊環境中的車牌辨識流程!如果正常辨識程序的符合度就很高了,當然就快速通關結案。但是碰到車牌汙損破爛時就會發現不太確定答案是否正確,就要啟動多種辨識流程做整體評估了!

所以簡單可以辨識確認的車牌時間就會很快,難辨識的車牌就可能會需要好幾倍的時間了!但是代價是合理的!我終究還是可以得到最正確的答案!也不需要每一個案例都花費那麼多的時間,絕大多數正常車牌的辨識時間都是很快的!這就是我們一般人面對困難辨識時會做的事情,「慢慢仔細看清楚一點」!

但是你看的AI影像辨識技術,如CNNMLOpenCV有告訴你類似的概念嗎?他們真有做出跟我一樣可以商業化的影像辨識軟體嗎?所以你要多相信這些AI影像辨識技術的「實力」?或者退好幾步,保守一點說:他們有多大的「潛力」呢?你還相信CNN與ML是影像辨識的「主流」與「未來」嗎?先請他們拿出實績再說吧!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入