用不用CNN辨識速度就是差那麼多！ - 鄉下老師

Contents ...

udn網路城邦

精選

用不用CNN辨識速度就是差那麼多！

2025/03/01 05:22

迴響0

推薦9

引用0

我近期的文章一再強調我已經引用CNN(類神經網路)的模糊辨識技術到我的車牌辨識程序之中，當然好處是可以提高車牌字元模糊時的辨識正確率，彌補OCR辨識技術過於依賴必須辨識出完整字元形狀才能正確的弱點。但是如我一向強調的論點，CNN跟ML或DL一樣都是非常耗時(高運算量)的技術，即使我只是在已鎖定的車牌範圍與邊緣地區少量使用，辨識時間拉長辨識速度變慢的情況還是很明顯！

如上圖就是一個典型案例的比較，左邊是我設計給道路版軟體使用的流程，因為車速很快必須要求最大的辨識速度，所以是不用CNN的！時間只需36毫秒，右邊則是設計給一般定點拍攝影像或停車場使用的軟體，速度要求不高時，我就充分利用CNN技術來提升辨識正確率，需要的時間就是126毫秒！兩者相差高達3.5倍之多！

當然，跟市售的其他車牌辨識軟體比較，兩種模式應該都還算是蠻快的！這也是我可以適度使用CNN的原因：我的基礎演算法真的有夠快嘛！但是我想負責任地跟大家解釋，我的軟體在不同應用情境下還是有區隔的！影像清晰理想時兩種模式當然都沒問題，但是碰到影像或車牌品質較差時，有CNN的辨識率就會比沒有CNN的好上幾趴了！代價呢？就是多出蠻多的計算時間！

從上圖的參數上有無CNN最大的差異在字元辨識的次數！所謂的CNN就是利用矩陣掃描的方式評估所有位置的最佳辨識結果，不用CNN時其實也必須在鎖定的字元目標上套用字元矩陣符合度辨識的！只是套用次數較少而已！所以兩個模式分別是做了26次與311次的矩陣運算，也就是CNN方法中說的Convolution，辨識時間的主要差異就是來自於此了！

用白話文說就是：CNN會作較全面的評估考慮再做最後決定，OCR則比較直接不會想太多！運算時間的差距呢？就是好幾倍！這還只是以OCR先找到車牌位置做出的結果，如果主流程架構就直接使用CNN來鎖定車牌位置呢？那差距就不是幾倍，而是幾十或幾百倍了！沒有包括GPU等周邊設備的幫忙，絕對是跑不動，或是速度慢到離譜的！這也表示你必須使用貴上很多倍的特殊電腦設備才行！

我有沒有誇大其詞詆毀CNN呢？就跟我愛看的警察辦案節目一樣，那要看我是否有犯罪動機了！貶低ML、DL與CNN都對我的生意與聲譽沒幫助的！還會被支持那些AI技術的人質疑，為何我和多數專家說法不同？我沒有動機要為此說謊！反而是支持ML、DL與CNN的專家們都避而不談OCR辨識技術的極高效率，那才是有充分動機的欺騙行為！大家都知道後還會買那種影像辨識產品的人就很少了！

天下沒有白吃的午餐！要得到某種結果就一定需要運算的過程，絕對不會無中生有的！我們可以研究讓必要的計算更精簡快速，但這是有極限的！CNN再怎麼用YOLO的第X版加速，速度還是比OCR慢上多倍的！這個事實AI專家們都心知肚明，但是都會刻意隱瞞，不然你就不可能買他們的產品了嘛！事實是他們太早放棄讓OCR持續進化的努力，所以沒辦法和我一樣推出不必依賴ML、DL與CNN的高效率影像辨識產品！只能在那個狹義的AI同溫層取暖了！歷史終究會證明我是對的！

對於不懂內情的外行人，可能覺得這些AI影像辨識過程很神祕？但是如果你的研究夠深入，就會把所有的可能性看得跟我一樣十分清楚！再怎麼AI都不會發生超自然的靈異現象的！一旦使用了CNN絕對會「變慢」很多，不然就是「變貴」很多！沒有任何轉圜空間或其他可能的！這就是你在影像辨識的市場上很難看到他們的原因了！

總之，所有的AI到了最終產品就是依據數位資料做必要的運算得到你要的結果，還是一步一腳印的過程！不會有甚麼大神駐守加持的！如果你是研究者就應該務實的研究運算過程與細節，如果你是買家使用者就必須追問AI業者的技術內涵，絕對不能相信有甚麼神奇技術可以超越你能懂得的科學與常識！就像不能相信有任何穩賺不賠的投資方式一樣！不然你就是等著被詐騙的肥羊了！