
理論上,同樣的取景範圍,解析度越高的影像,辨識正確率當然會越高!資訊越充裕就越容易做出正確的判斷嘛!回想12年前我還在跟320X240,就是只有幾萬畫素的影像掙扎,辨識率當然很難提高!也因此那個年代的車牌辨識系統還非常稀有,因為要取得畫素夠高較容易辨識的影像成本實在太高了!
但是那個時候我就看到了影像辨識即將起飛的兩個徵兆!首先是百萬畫素的影像開始出現成為一般規格的產品了!有了高畫素的影像自然可以提高辨識率,隨著智慧手機的普及,畫素只會越來越高還會越來越便宜!有了高畫素影像如果電腦計算速度跟不上,一張影像必須辨識好幾秒也不行的!停車場的車牌辨識系統必須立即反應要不要開柵欄的!如果每個車牌辨識都要三秒鐘就會急死也氣死人了!
此時多核心電腦的適時出現就是另一個契機了!電腦計算快辨識速度就快了嘛!有了好食材加上高效率的廚房設備,我只要好好研究廚藝就可以開個效率品質都很好的餐廳了!也就是說:高品質影像與高效率電腦都已隨手可得,擋在影像辨識應用之前數十年的路障都撤除了!好像當年美國西部拓荒的歷史,沒有財力資源的一般人也可以靠著自己的努力去創造事業財富了!
我就是看準這兩個資訊環境的巨變決定勇闖影像辨識事業的!因為即使是世界級的國際大公司,面對新的變局他們的辨識軟體也必須全部打掉重做的!我跟美國矽谷或歐美先進廠商,都是站在同一個起跑線上,開始比賽研發辨識演算法的速度!這個競賽跟錢多錢少?資源豐富與否?都無關了!就是知識、技術與創意的比拚而已!我即使窩在台南的家裡做研發也不會居於劣勢的!
事實證明就是如此!我的公司就是白手起家,十一年後還是沒倒閉,在台灣的影像辨識市場上屹立不搖!足以證明在這個時機點上,做影像辨識研發確實不必依賴甚麼財力與人脈,只要書讀得多、夠努力、夠有創意就有機會成功!就像我現在正在研發我從沒去過的新加坡的車牌辨識一樣,需要這個辨識軟體的廠商會主動提供我研究素材,我只要有研發能力,不必到新加坡開分公司駐點經營,在家工作就皆大歡喜了!
一個有趣的現象是:現在的影像畫素似乎越來越超標了?畫素高到電腦的多核心CPU也跟不上了!加上越來越多人採用CNN與DL等大量消耗計算量的低效率演算法,所以用一般規格的電腦辨識速度開始慢到讓人抓狂了!多慢開始會讓人不舒服呢?我自己的經驗直覺標準是0.5秒!一張影像辨識超過0.5秒,使用者就會覺得不夠「即時」了!至於是0.05秒?或0.35秒?就比較無感了!這大概就是你點一下滑鼠後期待電腦有反應的合理延遲時間。
目前多數人面對這種算力不足的困境,當然就是大量使用GPU來救援了!但是那必須花很多錢在硬體設備上!我是一個連花錢買GPU裝在自己研發用的工作電腦上都會嫌貴的小氣鬼!我相信大多數潛在的影像辨識使用者也都不想或沒有能力花太多錢買GPU電腦!所以我的優先目標就是:研發不必使用GPU還是一樣很快的影像辨識軟體!
前幾天正在開發新加坡市場的合作廠商就給了我一批五百萬畫素的停車場出入口的車牌影像!這是我研究影像辨識以來第一次拿到那麼高畫素的資料,目前國內一般停車場出入口的車牌辨識都是50萬畫素就可以用了!即使是路口監視其拍的複雜街景中的車牌辨識,也只需要大約兩百萬畫素,500畫素真的有點超過了!
所以這批影像雖然辨識率很好,但是每張影像的辨識時間都會超過0.5秒的「即時」門檻,大約都是一秒多!我知道這樣上線使用時客戶一定不會滿意的!我的演算法也與CNN或DL不同,目前GPU的計算模式是無法配合我的傳統演算法的!我的軟體是有用平行運算,但都是以CPU的處理器為單位執行,所以即使客戶買了昂貴的GPU電腦,也無法讓我的軟體辨識速度變快的!
所以我必須設法在自己已經建構好的演算法上努力精進來解決這個速度問題!細節作法在此先不做詳細說明,但是我真的在三天內有了很大的突破!如上圖這張影像在四天前的版本辨識時間需要875毫秒,到昨天的版本就進步到375毫秒!也就是達到我的0.5秒的即時辨識的速度門檻了!
五百萬畫素的影像,大概只是磁碟存取或網路傳輸都要零點幾秒吧?但是我真的完全不用CNN或DL那些所謂的AI影像辨識技術,就是在傳統的OCR辨識基礎上努力研發,就是可以做到這種幾乎不可思議的辨識速度!你對影像辨識越是內行就越會被我嚇到!我的電腦真的很普通,但是我的武功夠好!就像武俠小說中說的:真正的武林高手不必用倚天劍屠龍刀,飛花摘葉都能傷人的意思!這個影像辨識的武功就是演算法了!
再次強調這種辨識速度是完全不必GPU加持的!一般規格的平價電腦上就可以做到!昨天已經提供測試版本讓他們在新加坡上線測試了!所以這不是誇大不實的廣告或電腦神話,500畫素的影像,0.5秒內就可以辨識完成,這就是我的軟體正常的水準!你還想為了作影像辨識買昂貴的GPU電腦嗎?未必需要的!用我的軟體就行了!
限會員,要發表迴響,請先登入






