Contents ...
udn網路城邦
我還沒這麼厲害,但是人的眼睛辦得到!
2019/01/29 08:30
瀏覽1,008
迴響1
推薦10
引用0

之前我以為香港車牌辨識軟體已經做得差不多了,正常影像品質下辨識率至少大於95%吧?但是驚聞他們最近現場測試時有低到七成辨識率的狀況!嚇死寶寶了!分析過影片才知道其實都是影像品質不良之故,如果有類似軟體跟我PK,我還是會遙遙領先的!

不過從這些欠佳的影像,也讓我體會到人的眼睛(加大腦)的影像辨識能力(智慧)真的超強!我的影像辨識技術還有得追的!譬如有輛車經過鏡頭的兩個停格畫面如下:

如果連續播放,用人眼專心看會彷彿看到一個完整的SR 3508車號!又如下面的停格影像,因為焦距與快門沒配合好,影像產生疊影,字元就變模糊了,用一般的影像二值化程序,每一個單張影像都是很難準確切割出所有字元的!即使切得出來,比對字模時符合度也不高的!但連續播放時用人眼卻看得蠻清楚的!就是JR 8771嘛!

這是甚麼意思?以我目前的技術水準,雖然說是作「動態」影像辨識,但基本上還是大量的「單張停格影像」的辨識。譬如第一個例子,前一張可以辨識出3508,後一張可以辨識出SR 35,好像可以拼湊出一個完整的車牌號碼?但我的程式還沒聰明到能判斷出這是同一張車牌的前後段!至少我還沒開始這麼寫程式處理辨識結果,但是我們眼睛的視力機制就會這麼作!所以我們「感覺」可以看到完整的車牌!

疊影的狀況也相似,如果好幾個有疊影的字元「疊合在一起」應該就是比較清楚可辨識的字元了!我們當年學地球物理作震測資料處理時就有類似的處理程序,將雜訊很高的地層反射訊號疊合,雜訊就被壓低,地層看起來就清楚多了!稱為Stacking!我現在的軟體當然沒作得這麼功夫,就是要將前後幾張中的模糊字元分別抓到並加以疊合再辨識字元,想像一下那要多複雜的運算啊?

即使我知道上述這種:人的腦中確實有在運作的「程式」,我也真的可以將他們寫出來,一般電腦硬體也來不及這麼快速的作好這麼多的處理程序。超級電腦可不是人人買得起的!當計算資源有限只能用一般電腦時,就只能集中火力辨識正常的車牌影像,這些特殊狀況就只能請客戶將影像品質提升一點囉!

所以這不表示我不知道如何處理他們?而是成本的問題,如果要我寫這麼複雜的程式,我必須研究好一陣子,研發期間還是需要吃飯的!誰出錢?更何況,即使我真的寫出來了,沒有超規格的電腦大概也跑不動,來不及即時辨識出這種模糊影像的答案,我估計也不會有人閒錢太多,買超級電腦來辨識車牌的!所以我的軟體也賣不出去,我就血本無歸了!

可見人工智慧的研究之路還長得很,尤其是現在所謂的「主流」派沉迷於機器學習,他們是想讓電腦自己摸索寫出這些程式嗎?如果電腦真的「學會」了!它會教給我們這些真人嗎?即使會,這些機器學習的教徒們真的願意聽電腦講課嗎?還是只願意在一旁打電動等電腦提供正確答案就好了?這麼玩法,最後人類不就輸給人工智慧了?魔鬼終結者不就真的會出現了嗎?

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:教育學習

限會員,要發表迴響,請先登入
迴響(1) :
1樓. 方正平
2019/01/30 23:47
現在的手機和數位相機大概都內建HDR功能,好像就是利用很多張影像疊合在一起的功能