Contents ...
udn網路城邦
影像辨識的目的需求會決定你應該用的技術
2020/11/24 04:03
瀏覽798
迴響0
推薦8
引用0

國產開源CNN架構HarDNet新進展,部署低功耗邊緣裝置影像辨識評比全球前五強

CNN等技術的發展方向,看起來就是挑戰人眼在複雜狀況下的快速辨識特徵的能力!我也很贊同支持這種研究方向,但是我有兩點提醒:第一是CNN的多尺度偵測架構,運算量不會比傳統的OCR辨識目標的運算量小!CNN算得再快都不會比OCR快的!因為OCR不會有多尺度的運算的需要嘛!學術界似乎太早放棄從OCR技術的角度研究達到類似目標的可能性了?

我自己就是嘗試從OCR的技術角度開發車牌辨識核心的,因為五六年前我也根本不知道CNN這種概念,但是事實可以證明,我用傳統OCR技術為基礎做出來的車載車牌辨識系統,辨識速度並不會比這些神奇新科技差,事實上是較快,一樣可以達到很高的辨識率,應該說是更準!台灣目前最快最準的道路動態車牌辨識軟體是我用OCR做的!並不是CNN!這應該可以讓大家思考一下為什麼吧?

科技追稅! "車牌辨識"掃描逃漏稅車

我是一個尊重科學的科學家,我一定會努力理解甚至整合任何新的技術,如果它們真的夠好的話!但是請大家也看清楚一些事實,CNN或機器學習其實還沒有好到可以直接在影像辨識領域取代傳統的OCR技術,或許永遠不會!最終可能只是各擅勝場而已!

更重要的第二點提醒是:多數我們急需要的影像辨識應用,其實並不是挑戰人眼的模糊識別判斷能力,而是在較簡單的情境下,達到極高的辨識率,最好是百分之百!CNN與機器學習的基本概念是「提高辨識率」而不是找到確定的答案!先天上就有較高的不確定性!所以像停車場情境的車牌辨識,一般生產線上的AOI,乃至文件證件或考卷的辨識等等,其實都是「不適合」也「不需要」使用CNN的!

改考卷時97%的正確率是絕對不夠的!國家考試閱卷錯誤率3%那就是大災難了!高於萬分之一錯誤率的辨識核心就絕對不能用了!CNN與機器學習追求的目標根本不是這樣的!所以我想提醒大家的是:像是閱卷或辨識證件這種需求,你一開始就「不應該」,甚至「不能」選擇使用CNN或機器學習的解決方案!一定要用OCR技術才對!

同樣是影像辨識,但是CNN,機器學習或深度學習所挑戰的戰場與上面提到的大多數實務影像辨識領域需求是不同的!如果是辨識街上奔馳而過的車輛車牌,可能是CNN的強項,但是如上圖停在定位上的車牌辨識率沒有99.9%的正確率其實就是不及格的!傳統的OCR在這種應用上絕對是完勝CNN!原因不是誰比較強?而是誰比較適合這種目的應用!

我的研究歷程比較特殊,其實是硬拿著OCR的技術,挑戰與CNN類似的模糊辨識目標!如果以車牌辨識這個議題來說,我其實也沒有輸!市場上還沒有以CNN為基礎的車牌辨識產品足以跟我挑戰!我不是想藉此否定新的技術,我甚至正在積極學習之中!我只是希望提醒大家,傳統的OCR技術其實完全沒有落伍,市場上的合理應用範圍甚至還大於CNN等技術!

如果你真的希望投身影像辨識這個行業,千萬不要因為CNN等新技術的聲量太大而迷失!影像辨識就是影像辨識,CNN的演算法也是來自OCR的概念,不要像是文化大革命一樣,來個不必要的破四舊?一定要好好學會傳統既有的影像辨識概念技術!他們跟牛頓定律一樣重要,絕對不是說愛因斯坦的相對論出現後,牛頓定律就可以淘汰了!截至目前理工領域內,牛頓定律的用處還是遠高於相對論的!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入