一張圖告訴你我的車牌辨識效能，YOLO真的有比較好嗎？ - 鄉下老師

Contents ...

一張圖告訴你我的車牌辨識效能，YOLO真的有比較好嗎？

2026/05/29 10:57

迴響0

推薦14

引用0

現在很紅的影像辨識技術YOLO你知道是甚麼意思嗎？就是You Only Look Once的意思！為什麼只看一次就是很厲害？原因是它的基底技術是CNN，基本上就是無差別的用特徵矩陣掃描全圖，這步驟叫做卷積(Convolution)，計算量大得要死不說，要找到不同大小的目標還必須用多種大小的矩陣掃描很多次！那就是嚇死人的高運算量，完全不可能在一般電腦上運作了！

但是主流派專家實在太喜歡太偏袒CNN了！就是不肯放棄這條難走的路，所以在CNN的基礎上努力研發只需要掃描一次就可以找到大多數目標的演算法，就稱之為YOLO了！但是當然它還是CNN的變形，即使只掃描一次，計算量還是比傳統不用矩陣掃描運算的OCR大上很多很多倍！而且也會因此比正常的CNN少辨識到很多目標，就是以犧牲辨識率為代價減少運算量的意思！

所以即使是用YOLO技術，如果不呼叫GPU幫忙，在一般電腦上跑起來還是十足龜速的演算法！如上街景動態的辨識情境是完全無法使用的！你必須多花至少加倍的電腦硬體成本，就是買超貴的顯示卡，再安裝CUDA中介軟體之後，才能在一般電腦上跑出堪用的辨識速度！

所以當很多人在吹捧YOLO多好多棒多厲害的時候，我真的不知道他們在嗨甚麼？因為我只要用我以傳統OCR技術研發的軟體，不必使用GPU，就可以在一般電腦上非常輕鬆順暢的跑如上的街景動態車牌辨識了！

上圖右是我以我的動態辨識模式辨識的實驗畫面，基本上就是內建使用兩種OCR模式辨識兩次，擇優錄取！即使是兩次的OCR辨識118畫素影像，都只需要120毫秒！還完全不必用GPU！而且不論車牌大小都是可以全面一次掃描就全部辨識出來的！我的OCR每次辨識也都是只看一次的！我也YOLO了！還不需要做矩陣的Convolution所以速度快很多！

如果是不趕時間的靜態辨識呢？我的辨識引擎軟體就會用更周詳的多策略OCR辨識六次！再擇優錄取！所以非常模糊破碎的車牌都有機會被極端模式的OCR程序辨識成功！付出的代價當然就是辨識時間較長，但是如上圖左所示，也只需要384毫秒而已！一樣不需要GPU幫忙的！

所以我真的很想問：YOLO真的有比我的OCR好嗎？好在哪裡？真希望他們能被我激怒來踢館挑戰！因為我真的完全無法理解！事實上市面上好像也買不到他們在YT上展示的那種動態辨識軟體，即使買得到大概需要的硬體也會貴到讓人很難買得下手吧？