Contents ...
udn網路城邦
合理智慧的辨識流程才會又快又準!YOLO對我是沒用的!
2025/02/09 03:38
瀏覽562
迴響0
推薦2
引用0

目前正在用很多困難的案例調整新版辨識流程的各種極端處理能力,也越來越能肯定我替東南亞車牌辨識發明的新辨識流程的合理性與智慧能力!如上的嚴重車燈炫光狀況就是一個很好的例子!第二張圖按照舊版的程序必須動用很多耗時的例外處理程序,所以辨識時間多了好幾倍,最終還是辨識錯誤!新版卻能以極快速度正確辨識成功!

關鍵是新的辨識流程可以用更合理準確的局部推理局部處理,不需要太多次的全圖處理嘗試,就能得到正確的答案,所以不但正確,速度還快很多!以此例來說:那個非常不清楚的L字元是這個辨識成敗的關鍵!理論上我們用人眼視覺如上圖其實勉強可以辨識那個L,那就必然可以用影像處理鎖定這個目標!只是必須付出的成本代價不同,成本太高就會失去實用的價值

我的舊版概念是必須先在全圖中用二值化切割目標的方式鎖定到「所有」的字元,也就是正確涵蓋所有車牌字元的完整車牌區域,但正常的二值化程序是抓不到太黯淡的L的,改用極端的二值化策略重作好幾次全圖二值化找L,速度就會很慢了!即使鎖定了正確的車牌區,因為車牌內部的極端亮度變化還是太大,最後還是失敗了!

但是新版的策略不一樣!全圖處理時不會堅持必須找到所有字元,只是假設我的車牌搜尋有可能漏掉邊緣的字,在抓到概略車牌位置之後會稍微擴大處理區,以此例來說,原本沒被鎖定的L也會進入這個擴大的處理區域!之後我即使要在此小區域做很極端的字元搜尋處理,就是很多次的局部CNN,也不會很耗時了!

簡單說,已經進入我的二級處理程序的L再怎麼狡猾難辨識,都是甕中之鱉了!以全圖的範圍來說,要直接發現有那麼黯淡的L非常困難耗時,但是如果已經在很小的車牌可能範圍內就是完全不同的故事了!它插翅也難飛了!非讓我正確辨識到不可!

我很不同意CNN的概念就在這裡了!當他們發現類似上述的困難時,他們知道多次全圖掃描太慢了,就極力讓掃描只需要一次,那就是YOLO(You Only Look Once)的基本精神了!就是在一次掃描中盡量蒐齊所有可能會用到的特徵,但這只是讓多次掃描的工作集中在一次完成,並未節省太多運算,未掃描前也不確定甚麼特徵是對最終辨識有必要的!只能浪費時間鉅細靡遺通通要了!

如果他們用很多機器學習獲得的「經驗」來省略可以不必蒐集的無用罕用特徵呢?那就表示他們會放棄如上這類極端案例成功辨識的機會,那麼黯淡模糊的L當然是非常罕見的!所以他們經過學習之後就變成只能辨識一般狀況比較清楚的車牌了!所以他們使用的省時方式,其實是一定會以降低辨識率為代價的!但是對於極力要提高辨識率的影像辨識軟體研發來說,這是完全無法接受的退讓妥協!

所以大家不要再盲從吹捧YOLO是甚麼影像辨識必用的神器了?如果YOLO真的好用也有用,我會比任何人都先搶著用的!因為我比各位讀者都更急著做出好的影像辨識產品賺錢嘛!但是我從理論上就知道他們是對於「提高辨識率」與「節省時間」無法兩全的一條死路!所以我一定不能用的!而且我也找到(發明)了更好的替代方案!會因為我不用YOLO而貶低我的人才是真的大外行!

有誰推薦more

限會員,要發表迴響,請先登入