Contents ...
udn網路城邦
為什麼碰到困難的辨識我的AI軟體會想比較久?
2026/02/06 04:24
瀏覽50
迴響0
推薦0
引用0

我是做車牌辨識產品研發的廠商,但是我很難回答一些看似簡單的問題?譬如我的車牌辨識率是多少?這就像問我參加一個考題內容未知的考試會拿到幾分一樣,考題簡單可以是100分,考題刁難時,我也可能吃鴨蛋的!記得讀建中時某次模擬考化學科全校平均才16分!這表示建中生很笨嗎?當時坐在我隔壁現任台大化工系教授的同學也是只有二三十分的!

其實當你問我的軟體辨識速度多快時,譬如X萬畫素影像需要幾毫秒?我也是很難回答的!譬如上面這種640X48031萬畫素的影像,內容簡單好辨識時可以快到幾十個毫秒就辨識成功正確,但碰到如上字元相當模糊時,我雖然還是辨識出來了,但是卻花了算是很長時間的482毫秒!

如果我的車牌辨識只是像一般深度學習派的說法與做法,就是用大量資料訓練出一個非常複雜聰明的模型,也就是一個很完備的影像辨識SOP,那同樣大小的影像辨識時間應該差不多。但我的車牌辨識軟體面對難易狀況不同時,差到10倍都有的!原因是我的內建辨識程序不是只有一個,而是高達六個

如上圖是我內建的六種辨識程序中的六個二值化圖,它們是按照辨識成功率的經驗值排序的!成功率越高的越先使用,如果得到的答案分數夠高就直接結案了!不太確定就會繼續使用其他方案,此例是用到第四個方案時才出現合理答案,但事實上六種算法都算過了!所以辨識時間才會那麼長!

如果辨識軟體是用在很趕時間的情況,像是我的高速動態辨識的車載車牌辨識軟體,那就只會用最高辨識成功率的一個SOP!因為影像會高速湧入,辨識失敗就必須立即放棄,沒時間讓你「慢慢想」!但好消息時下一張影像通常還是有同一個車牌在裡面,你有很多次的機會辨識同一個車牌!以單一車牌的辨識率來說不會太低的!

另一方面,如果像上例是由停車柱拍的單張影像,同一輛車不保證可以被拍到很多次,所以必須盡力在單張影像中就做出最好也是唯一的辨識結果!好消息時這種辨識使用情境通常不趕時間,單張辨識超過一秒鐘也沒關係的!停車柱可能30秒或一分鐘才會拍一張嘛!

所以大家知道我的車牌辨識軟體和所謂的「AI」深度學習基本概念上的差異了嗎?我並沒有執著在要「訓練」或「設計」出一個萬靈丹,期待一個SOP就可以辨識車所有的困難狀況?而是用六個臭皮匠嘗試湊出一個諸葛亮的智慧!這是使用CNNDL的人無法模仿的!因為他們的運算量大到一個SOP就算不完需要GPU幫忙了!用六個SOP做車牌辨識?那連輝達加上台積電的硬體技術都跟不上了!

我能這樣玩的關鍵其實還是我的基礎演算法,也就是傳統的OCR加上我的優化設計,讓演算量極少效率極高!所以即使內建六個SOP,在一般規格的電腦上跑起來還是顯得輕鬆自在游刃有餘!各位看官,你們覺得是我的架構比較聰明有效?還是他們吹噓的,用CNNDL做的「AI影像辨識」呢?


限會員,要發表迴響,請先登入