Contents ...
udn網路城邦
我和CNN都在追求快速抽象認知的能力,那誰領先了呢?
2025/01/13 01:38
瀏覽618
迴響0
推薦5
引用0

這張影像有123萬畫素,陰暗處有個真正的車牌,但是背景相當複雜,還有個其實不是車牌的商店招牌「HEERETEA」字元的排列組合與車牌非常近似,甚至比真正車牌的對比度更好!以柬埔寨的車牌法規來說,那個招牌的字元內容也是符合自訂車牌規範的!也就是說,以格式來說,它真的是可以被視為合格車牌的!

所以要在這個影像中「認知」到正確的車牌,是個需要相當高智慧程度也就是AI程度的「辨識」過程!即使是用人的眼睛與大腦來辨識,大概也必須看清楚之後,再想一想才會得到正確的答案!過程絕對不只一秒鐘吧?但是我的軟體卻可以在88「毫秒」,也就是不到0.1秒之內就做出跟聰明的人一樣正確的判斷!

這就是影像辨識研發追求的目標了!大家都想做出跟人腦一樣聰明的辨識軟體,如果可以達標,還希望比人眼與人腦的判斷更快速!以此例來說,我完全做到了!我沒有忽略掉陰暗處的真正車牌,也沒有被看似明顯也合乎規格的目標所騙,正確判斷出唯一正確的車牌!而且比人的判斷速度更快很多!

我現在作影像辨識「號稱」自己很強大的對手,就是CNN(類神經網路)!這個技術的核心理念與目標,就是如何經過影像細微特徵的掃瞄,「認知」到想找到的目標!但是我知道這個過程不只是CNN所說的那些目標特徵而已!那只是粗淺的第一步,要做到我目前已經做到的事情,需要考慮處理的事情還有很多!

譬如找到可能的目標組合之後還必須作幾何修正,讓歪斜的車牌變成接近標準正面的車牌影像,之後一一辨識字元時還必須考慮是不是符合已公告的標準車牌字型?還必須考慮環境因素,這個可能的「車牌」出現的位置周邊特徵是不是合乎車牌出現的可能性?

這些考慮我都做到了,所以我可以正確辨識這個案例!那CNN(YOLO)呢?我沒看過任何文獻討論過他們想得比我多!你看過嗎?你想過要正確辨識街景車牌時有這麼複雜嗎?我都想過!也已經為此努力研發好多年了!所以才會有此能力與成效!知道這些事實差異之後,你還會認定「主流」的CNN是比我先進的技術嗎?我已經贏了!而且絕非僥倖!

更尖銳的對比就是需要的運算量,也就是達到一樣辨識能力的處理速度CNN(乃至YOLO)跟我的技術相比,實在是慢到比烏龜還不如的技術!做一次全圖的Convolution時間就是我完成整個辨識的好幾倍了!為什麼網路資訊說的都是YOLO有多快?原因是他們根本不敢,或未曾跟我的傳統OCR技術相比!而且還必須依賴GPU等額外的設備分散大量運算才能稍微快一點的!不服氣就拿本文末的附圖讓你的CNNYOLO試試看!歡迎有好的結果時來踢館!

我老實說,我的車牌辨識就是使用傳統影像辨識最常用的OCR技術為基礎的!不僅於此,我在此基礎上已經做了非常多的研究,解決了很多OCR技術的缺點,包括處理車牌字元可能發生的沾連與破碎狀況,幾何修正為正面車牌的技術,還有篩選無效目標的邏輯等等,讓本來就比CNN快上不只十倍的OCR技術更快了!

所以我才能不需要GPU,也不必買輝達的任何軟硬體產品,在一般規格的電腦上就做出如上的驚人成績!在88毫秒的極短時間辨識出123萬畫素複雜影像中的不明顯的車牌!這不就是我們作影像辨識積極追求的目標:抽象且快速的辨識能力嗎!我做到了,CNN做得到嗎?

CNN的橫空出世標榜的就是我說的這種快速認知能力!大多數人也都相信買單了!但是CNN真的做到了嗎?他們有做得比我好嗎?就拿下面這種案例讓CNNYOLO試試看吧!AI不應該是迷信或邪教,大家必須多多驗證理解,才會找到真正好且合理的AI影像辨識方案的!我的車牌辨識完勝擊潰CNN的事實你看到了嗎?你在意事實嗎?還是只相信AI詐騙的廣告?我歡迎任何實質技術的挑戰!CNN你敢面對嗎?

有誰推薦more

限會員,要發表迴響,請先登入