Contents ...
udn網路城邦
甚麼都能辨識,就是甚麼都辨識不好的意思!
2020/07/06 04:30
瀏覽950
迴響0
推薦11
引用0

台俄攜手研發,全球最快影像辨識技術亮相

有位教授網友問我對這種技術的看法,這是我的榮幸,我也在此很嚴肅的提出我的意見。首先我希望大家認知到:數學的演算法要算出任何結果,必須依據具體的資訊,也必須有一定的加減乘除過程,所謂速度快就是精簡不必要的運算,就像理工科的人最熟悉的推導公式一樣,精簡公式之後就可以達到最佳的計算效率。

但那一定是有極限的,而且很快就會達到一個再也無法更快的地步,我就是作演算法研究的人,我的車牌辨識產品也是以速度極快著稱的!任何真的做過相關研究的人就不會有太浪漫的期待,演算法只是依據已知事實推論出結果的工具,他們不會無中生有,也不會神奇到超乎科學家能理解的程度,不必因為它執行速度快就覺得裡面有甚麼神仙?一定沒有的!

這一部份想說的是:速度快不快並不是重點!能確實作到甚麼事情才是重點!我教學生寫程式的三步訣就是:功能效能介面,需要的功能如果不能作到,速度多快都沒有意義。反之,只要功能達到了,要優化計算過程讓速度變快,就是推導公式的演練,或用到一些概數的技巧,很多步驟做地毯式完整計算和抽樣式的概算結果是會一樣的!那就抽樣計算即可!不會很難的!任何演算法我們應該關注的首要事情是它能否得到我想要的答案?而不是速度!

我極度不看好這種物件偵測技術的原因,就是他們逃避現實盲目的追求「廣用」與「快速」!卻不願意針對特定目的好好做到最高辨識正確率。廣用的物件偵測就是好像甚麼都「可以」追蹤得到,但每一種目標物件的擷取率或正確率都不太高,譬如上面報導說的43.5%物件偵測率,即使比上一代產品高了10%,那又怎麼樣?還是很低啊!誰會用辨識率43.5%的車牌或人臉辨識系統呢?不到九成的應該就沒人要了!

像上面這種街景畫面中,目前科技執法單位期望的車牌辨識率是至少85%,所謂的43.5%也只是偵測到物件而非辨識出物件內的車牌號碼43.5%再打八折是多少?繼續期待這種「高科技」,還要多久才能達到車牌辨識正確率85%呢?就像是用散彈槍打遠距離的麻雀,永遠都打不到的!但是我現在賣的車牌辨識軟體就已經超過85%了!我比這些科學家都聰明厲害嗎?未必如此!我只是針對特定目標做出最佳化的辨識而已,這件事我做了五年才做到目前的水準,就是「」辨識車牌!他們想要的太多了,所以失焦跟不上我!

我認為目前大家對於AI認知最大的謬誤,就是太急著想得到包山包海的解決方案,以為電影中的AI再過個十年八年之內就會實現?所以這種「好像」可作為影像辨識「基礎」的技術就會受到過度的尊崇與期待,但是籠統的辨識與精確目的的辨識意義完全不同!AI絕對不會在幾年之內全面實現,一定是像拼圖一樣點點滴滴聚沙成塔耗時至少幾十年的過程,就像你不會只學一個公式就可以將國中到大學的所有物理、化學與生物的習題通通解答正確一樣,太多細節必須一一學習處理了!

事實上目前市面上真正可以達到實用目的的影像辨識軟體,如車牌辨識、人臉辨識或指紋辨識都「不是」用這類大家以為熱門的技術,如機器學習或CNN等為基礎作出來的!即使如Yolo之類的技術也只是看好,但是根本還沒賣座的!要改變我對這些技術的負評,只有一個可能,就是市場上開始出現很多以他們為基礎研發出來的實用影像辨識產品。在此之前,我勸大家跟我一起保持質疑的態度,以免上當受騙做出錯誤的投資與消費。

認真的科學家都會知道真實世界如此複雜,每一種需求需要面對處理的資訊又如此不同,目標不明確的影像辨識技術用處不大的!就像甚麼都懂一點的半調子科技通,去做名嘴是嚇嚇叫,但是去任何科技公司上班都不見得會有產值。我作車牌辨識作得不錯,但有客戶問我人臉辨識作不作?我都是直接回答:「我不會!」沒有誰甚麼都會的!要我推出可以賣的人臉辨識軟體,我至少要閉關修練三年!

任何一種影像辨識在人腦裡都是一種經過長時間學習之後建立的精準過程,當你在路上找「」或找「計程車」時,你腦中叫用的辨識程序一定是很不一樣的!包括你對「物件」的定義方式!所以一個可以找出「任何」物件的演算法根本是違反人類智慧發展的方向!人腦中的智慧已經證實可以使用,這些新潮科學家自以為是的辨識邏輯,則根本還沒被證實可以用,你敢相信他們會比幾億年的生物演化結果更高明嗎?我是不敢!

我認為務實認真的影像辨識科學家,應該致力於研究每一種辨識目的需要釐清的目標物件特徵,而不是「廣義」的物件特徵,甚麼都能辨識的演算法就是甚麼都辨識不準的演算法,做得再多再快,都還是沒有實用價值的演算法!但是他們不是說已經在實際上線使用了嗎?問問他們現場的實際事件或物件辨識成功率吧!他們不敢說的!

像Yolo這種物件擷取演算法所以會紅的一個主要原因,是從影像到簡化資訊成為可處理物件的過程相當複雜,可以選擇的過程選項多到讓一般影像處理者無所適從,即使勉強做出來,因為運算複雜耗時,就顯得很不實用!所以即使自製演算法真的可以鎖定自己要的物件,也多半會自動放棄,將這一段路交給更專家的人去處理。但是這些專家不是為你的目的做發明的,執行速度或許很快但是不會完全對味!

須知,那些選擇如何由原始影像資料逐步建立你想找的物件過程,正是有效影像辨識研發的重點工作!每一個過程設計與選擇都會影響你正確抓到需要物件的效率,把真正重要的核心研發工作外包,你就注定不會做出甚麼好東西了!所以千萬不要有偷懶的心態,只想套用Yolo不會對你的工作有太大的幫助!你必須耐心逐步的建立自己專屬Yolo!

有誰推薦more

限會員,要發表迴響,請先登入