Contents ...
udn網路城邦
用不用CNN辨識速度就是差那麼多!
2025/03/01 05:22
瀏覽940
迴響0
推薦9
引用0

我近期的文章一再強調我已經引用CNN(類神經網路)的模糊辨識技術到我的車牌辨識程序之中,當然好處是可以提高車牌字元模糊時的辨識正確率,彌補OCR辨識技術過於依賴必須辨識出完整字元形狀才能正確的弱點。但是如我一向強調的論點,CNNMLDL一樣都是非常耗時(高運算量)的技術,即使我只是在已鎖定的車牌範圍與邊緣地區少量使用,辨識時間拉長辨識速度變慢的情況還是很明顯!

如上圖就是一個典型案例的比較,左邊是我設計給道路版軟體使用的流程,因為車速很快必須要求最大的辨識速度,所以是不用CNN的!時間只需36毫秒,右邊則是設計給一般定點拍攝影像或停車場使用的軟體,速度要求不高時,我就充分利用CNN技術來提升辨識正確率,需要的時間就是126毫秒!兩者相差高達3.5倍之多!

當然,跟市售的其他車牌辨識軟體比較,兩種模式應該都還算是蠻快的!這也是我可以適度使用CNN的原因:我的基礎演算法真的有夠快嘛!但是我想負責任地跟大家解釋,我的軟體在不同應用情境下還是有區隔的!影像清晰理想時兩種模式當然都沒問題,但是碰到影像或車牌品質較差時,有CNN的辨識率就會比沒有CNN的好上幾趴了!代價呢?就是多出蠻多的計算時間!

從上圖的參數上有無CNN最大的差異在字元辨識的次數!所謂的CNN就是利用矩陣掃描的方式評估所有位置的最佳辨識結果,不用CNN時其實也必須在鎖定的字元目標上套用字元矩陣符合度辨識的!只是套用次數較少而已!所以兩個模式分別是做了26次與311次的矩陣運算,也就是CNN方法中說的Convolution,辨識時間的主要差異就是來自於此了!

用白話文說就是:CNN會作較全面的評估考慮再做最後決定,OCR則比較直接不會想太多!運算時間的差距呢?就是好幾!這還只是以OCR先找到車牌位置做出的結果,如果主流程架構就直接使用CNN來鎖定車牌位置呢?那差距就不是幾倍,而是幾十或幾百倍了!沒有包括GPU等周邊設備的幫忙,絕對是跑不動,或是速度慢到離譜的!這也表示你必須使用貴上很多倍的特殊電腦設備才行!

我有沒有誇大其詞詆毀CNN呢?就跟我愛看的警察辦案節目一樣,那要看我是否有犯罪動機了!貶低ML、DL與CNN都對我的生意與聲譽沒幫助的!還會被支持那些AI技術的人質疑,為何我和多數專家說法不同?我沒有動機要為此說謊!反而是支持ML、DL與CNN的專家們都避而不談OCR辨識技術的極高效率,那才是有充分動機的欺騙行為!大家都知道後還會買那種影像辨識產品的人就很少了!

天下沒有白吃的午餐!要得到某種結果就一定需要運算的過程絕對不會無中生有的!我們可以研究讓必要的計算更精簡快速,但這是有極限的!CNN再怎麼用YOLO的第X版加速,速度還是比OCR慢上多倍的!這個事實AI專家們都心知肚明,但是都會刻意隱瞞,不然你就不可能買他們的產品了嘛!事實是他們太早放棄讓OCR持續進化的努力,所以沒辦法和我一樣推出不必依賴ML、DL與CNN的高效率影像辨識產品!只能在那個狹義的AI同溫層取暖了!歷史終究會證明我是對的!

對於不懂內情的外行人,可能覺得這些AI影像辨識過程很神祕?但是如果你的研究夠深入,就會把所有的可能性看得跟我一樣十分清楚!再怎麼AI都不會發生超自然的靈異現象的!一旦使用了CNN絕對會「變慢」很多,不然就是「變貴」很多!沒有任何轉圜空間或其他可能的!這就是你在影像辨識的市場上很難看到他們的原因了!

總之,所有的AI到了最終產品就是依據數位資料做必要的運算得到你要的結果,還是一步一腳印的過程!不會有甚麼大神駐守加持的!如果你是研究者就應該務實的研究運算過程與細節,如果你是買家使用者就必須追問AI業者的技術內涵,絕對不能相信有甚麼神奇技術可以超越你能懂得的科學與常識!就像不能相信有任何穩賺不賠的投資方式一樣!不然你就是等著被詐騙的肥羊了!

有誰推薦more

限會員,要發表迴響,請先登入