Contents ...
udn網路城邦
演算法百百種,但商業產品一定要考慮成本的!
2024/05/04 05:12
瀏覽646
迴響0
推薦12
引用0

上面這種上下有深綠色槓槓的車牌是台灣車牌史上的最愚蠢設計!即使是人的眼睛看東西都會被這種莫須有的「雜訊」干擾的!對目前還是車牌辨識主流技術之一的OCR辨識殺傷力更大,因為字元一旦與背景的綠槓沾連就很難繼續辨識了!所以我高度懷疑這是那些CNN擁護者刻意設計出來陷害逼退OCR的陰謀?

如上就是一個典型的案例,EPA-153六個字元中只有53倖免於難!其他四個字都與綠槓槓藕斷絲連,剛好無法完全切割。以我的車牌辨識SOP來說,如果一個車牌中至少辨識到四個字元,其他缺字我會有一些補救機制去完成辨識,但是對於孤立的兩個字元呢?一定就是忽略它們了!好像一個天才兒童只因為某個愚蠢的條件被卡關就無法入學好好讀書變遺珠了!

此時CNN就會跳出來說:我可以解決這個問題!我會全圖找字元,沾不沾連的字都一樣完全不會遺漏!但是他們一定含糊其辭不肯明說的是費用很貴!很像觀光區拉客的海產店,一定說我們甚麼海產都有,價錢呢?你先坐下來再說!發現貴得離譜時已經很難脫身了!

簡單說就是CNN的演算法先天上就是很耗費資源的,所有的特徵都必須經過地毯式的全圖掃描,不同大小的目標還必須用不同大小的矩陣才掃得到!就是因為計算量實在大到不合理,才會需要GPU與輝達晶片的協助,當然也因此讓使用這種技術的系統更貴更慢更耗電了!一般人不太知道的是:其實有其他方法技術可以做得一樣好,甚至更好

那我可憐的OCR碰到只能辨識兩個字的情況怎麼辦?有解嗎?如果無解就必須向CNN全面投降退出江湖了!這個綠槓槓陰謀就得逞了!但我哪是省油的燈?我是諸葛亮,我會用草船借箭的!就是當我發現任何清晰可辨的孤立字元時,我會在這個字的附近用CNN的技術掃描找到其他沾連的字!照樣能辨識成功的!

重點是任何技術我都會合理使用在最適當的地方,OCR做不到的事情就用CNN嘛!沒問題的!CNN太貴嗎?我只是在局部關鍵的小區域,只用一點點就不貴了!要捐獻做一尊純金打造的佛像當然會讓一般人傾家蕩產,但是「鍍金」的呢?那很多人都供養得起了!白金比黃金還貴,但是汽車排氣管裡面就必須使用白金當觸媒轉換器,只要精準控制只用剛好可以達到目的的用量,非常少量的白金就誰都買得起的!

我的車牌辨識就是這種鍍金或是鑲白金的產品,同時具備多種演算法的優點,而且成本很低!就是運算量少,你可以用便宜的電腦設備就辨識得很快!理論上做得到的事情如果要花太多錢,還是等於做不到!就像我買不起千萬超跑,就很希望可以只用幾十萬買到差不多好甚至更好的平價汽車!我在影像辨識業界的角色就是能做出高效能平價車的工廠!他們宣傳的那種狹義的AI影像辨識其實是一般人買不起也不會去買的名牌包,你還有很多其他便宜的AI選擇的!

有誰推薦more

限會員,要發表迴響,請先登入