深度學習是需要大量資料來訓練演算法模型的,以影像辨識為例,通常會需要數百萬張圖片資料來訓練模型,才能找出演算法最合適的權重參數,達到最佳的準確率。當神經網路收到越多數據後,重新調整後就能產生更精確的預測。拜2000年後網路風行以及2012年後GPU的輔助所賜,影像辨識的應用和準確度有了突飛猛進的突破。
上面的圖文是節錄自一篇網路文章影像辨識應用與深度學習,我的公司是專門研發製作影像辨識產品的專業公司,製作的車牌辨識軟體已經是國內頂尖產品!不僅如此,我們還客製化開發了許多影像辨識核心產品,如電腦閱卷、證件辨識、瓦斯表辨識、貨櫃碼辨識、工地揚塵辨識等等,族繁不及備載!但是我們的產品中從未使用過深度學習的技術!
為了能跟上時代將影像辨識做到最好,我們一向都會積極學習任何可能有用的新技術!其中當然包括深度學習!但是至今始終不認為有需要使用,還發現了一些「不能」使用深度學習的原因!消極面就如上面引用文字說的:需要大量資料做訓練,資料取得與標註的成本實在高到我們這種公司無法負擔。我做車牌辨識十年了,產品已經暢銷全台,但是我的電腦中的車牌影像不過才幾萬張而已!如果需要幾百萬張影像來訓練模型的話,我怎麼活?事業還沒開始就破產倒閉了!
在積極的技術面考慮呢?也是從上面的影像中可以看出端倪,各位讀者發現那幾個人臉有甚麼共同特點了嗎?他們都是非常正面對著攝影機,也沒有人裝可愛歪著頭拍照的!如果有呢?要能正確辨識所有側臉與歪頭,即使你有無限量的資料都無法訓練出高準度辨識軟體的!因為旋轉與傾斜都是連續變化的函數,這會讓所謂的臉部特徵的變化可能性大到難以估計!
正常正面的影像要訓練到可以辨識的成本都太高了,更何況希望也能辨識歪斜的人臉?需要的成本不是會變成天文數字嗎?所以這種技術絕對不是一般規模的中小企業公司可以嘗試的!正因如此,才會讓Google之類的大公司極為興奮努力推波助瀾,讓所有人都以為未來的影像辨識都必須走深度學習這條路?其實明明用傳統的辨識技術就可以做得更好!不然我是外星人嗎?
果真如他們所說影像辨識的未來就是深度學習,我們這種作影像辨識的小公司就一定會完全絕跡!影像辨識這件事就會像網路搜尋引擎一樣,變成網路怪獸大公司的禁臠了!因為只有他們可以擁有並營運那些龐大到我們無法想像的超級電腦系統!沒有那些超級電腦與龐大的資料採購財力,就不可能順利實現深度學習的成效,我們這種人如果還想繼續做這一行也只能去怪獸公司投履歷求職了!
因為我就在這個影像辨識的行業中討生活,所以我知道這些都是別有用心的刻意炒作!事實上目前市面上的商業影像辨識軟體絕大多數都「不是」用深度學習做的!深度學習技術的成效與成本都還沒被充分考核驗證!他們說的是未來式,不是現在式!是虛擬大餅不是已出爐的披薩,大家必須要先認清這個事實!
而我這種公司就是現在式的代表!我的車牌辨識可以不用大量資料,也不必甚麼冗長的「學習」就做到如下圖這樣的辨識能力!這是已經出爐暢銷中的披薩,很多人也天天在享用,開發與運轉成本都很低廉,辨識率也極高!你要相信甚麼?一輛可以隨時試開檢驗的好車呢?還是一張未來神奇飛天車的設計概念圖?
如果這些怪獸大公司真的投入天文數字的投資之後,確實可以產出跟我這種辨識軟體能力相近的成果,我的生涯真的是會被迫結束的!現在大部分的人都已經被假AI洗腦,相信未來一定會如此?但是我可以提醒大家,這種用深度學習做影像辨識的炒作已經快十年了!如果深度學習真有此能耐,市面上的影像辨識產品早就被他們完全佔據了!
事實勝於雄辯,深度學習已經有機會與時間可以證明他們的優勢很多年了,但他們就是沒有成功!他們始終無法達到商業化需要的高辨識率!這跟資料量無關,我是從理論與實務上知道他們的弱點,所以認定他們永遠無法成功取代我的工作,你們聽不懂理論或不相信科學原理就依據事實觀察判斷吧!沒有就是沒有!
而且還有一個資安的因素,讓影像辨識的工作不可能通通送到Google等大公司的雲端!試問聯考的考卷與報帳用的發票可以上傳到雲端辨識嗎?如果過程中被攔截偷窺拷貝竄改誰負責呢?如果多數影像辨識工作都不能上雲端,必須在與外界隔絕的環境完成,在一般的電腦中開發與執行,一般公司買得起超級電腦來用深度學習模式作影像辨識嗎?
看懂了嗎?深度學習要搶走我的工作?真的連門都沒有!至少我的有生之年都沒有任何機會與可能性的!用深度學習作影像辨識只是一個遙不可及的夢想!對於多數一般人來說還不是個美夢,而是一個噩夢!如果他們做到了,你將失去資安與資料自主性!你的工作圖資與隱私Google全知道!你能接受嗎?我賣出這麼多車牌辨識軟體,但是他們每天在辨識甚麼影像?我不知道的!除非他們自願提供給我研究!