Contents ...
udn網路城邦
一張圖告訴你我的車牌辨識效能,YOLO真的有比較好嗎?
2026/05/29 10:57
瀏覽313
迴響0
推薦13
引用0

現在很紅的影像辨識技術YOLO你知道是甚麼意思嗎?就是You Only Look Once的意思!為什麼只看一次就是很厲害?原因是它的基底技術是CNN,基本上就是無差別的用特徵矩陣掃描全圖,這步驟叫做卷積(Convolution),計算量大得要死不說,要找到不同大小的目標還必須用多種大小的矩陣掃描很多次!那就是嚇死人的高運算量,完全不可能在一般電腦上運作了!

但是主流派專家實在太喜歡太偏袒CNN了!就是不肯放棄這條難走的路,所以在CNN的基礎上努力研發只需要掃描一次就可以找到大多數目標的演算法,就稱之為YOLO了!但是當然它還是CNN的變形,即使只掃描一次,計算量還是比傳統不用矩陣掃描運算的OCR大上很多很多倍!而且也會因此比正常的CNN少辨識到很多目標,就是以犧牲辨識率為代價減少運算量的意思!

所以即使是用YOLO技術,如果不呼叫GPU幫忙,在一般電腦上跑起來還是十足龜速的演算法!如上街景動態的辨識情境是完全無法使用的!你必須多花至少加倍的電腦硬體成本,就是買超貴的顯示卡,再安裝CUDA中介軟體之後,才能在一般電腦上跑出堪用的辨識速度

所以當很多人在吹捧YOLO多好多棒多厲害的時候,我真的不知道他們在嗨甚麼?因為我只要用我以傳統OCR技術研發的軟體,不必使用GPU,就可以在一般電腦上非常輕鬆順暢的跑如上的街景動態車牌辨識了!

上圖右是我以我的動態辨識模式辨識的實驗畫面,基本上就是內建使用兩種OCR模式辨識兩次,擇優錄取!即使是兩次的OCR辨識118畫素影像,都只需要120毫秒!還完全不必用GPU!而且不論車牌大小都是可以全面一次掃描就全部辨識出來的!我的OCR每次辨識也都是只看一次的!我也YOLO了!還不需要做矩陣的Convolution所以速度快很多!

如果是不趕時間的靜態辨識呢?我的辨識引擎軟體就會用更周詳的多策略OCR辨識六次!再擇優錄取!所以非常模糊破碎的車牌都有機會被極端模式的OCR程序辨識成功!付出的代價當然就是辨識時間較長,但是如上圖左所示,也只需要384毫秒而已!一樣不需要GPU幫忙的!

所以我真的很想問:YOLO真的有比我的OCR好嗎?好在哪裡?真希望他們能被我激怒來踢館挑戰!因為我真的完全無法理解!事實上市面上好像也買不到他們在YT上展示的那種動態辨識軟體,即使買得到大概需要的硬體也會貴到讓人很難買得下手吧?

有誰推薦more

限會員,要發表迴響,請先登入