Contents ...
udn網路城邦
侵入性的影像辨識資料處理
2018/08/01 07:07
瀏覽1,618
迴響0
推薦7
引用0

醫療行為中有所謂侵入式與非侵入式的治療,非侵入式就是吃藥或按摩等等,侵入式就是直接開刀了!如果可以吃吃藥做做復健運動就能醫好,當然誰都不願冒險開刀。但是有時候身體卡住了,或受到太大的外力傷害,吃藥或按摩都無法直達病灶,此時關鍵性的一刀就是最佳手段了!

在我的影像辨識處理程序中,也有侵入與非侵入式演算法的分別,非侵入式就是濾波、灰階、二值化、取輪廓、取目標等等,算是對原始資料做影像增強、摘要或擷取特徵的動作,但不會真的改變原始資料的內容。通常這就足以做好絕大部分的辨識工作,但就像治病,有時候這些正常程序就是差了臨門一腳,治不好一個關鍵的影像品質缺陷,此時運用合理的邏輯去「開刀」改變一部份的原始資料,也是我的選項!

像下面這張影像,雖有車燈干擾,但還算是很清楚的車牌,卻總是會漏掉下排的”2”字!這跟我的辨識程序是有關的,看看連環圖畫就知道了!

事實就是香港車牌的字元與車牌上下邊界,甚至雙排字時的上下排間距都很小!遇到影像稍微模糊,尤其是夜間,某些字元就會難以被正確切割出來,如果根本切不出來,自然無法核對字模說出它是甚麼字?以傳統影像辨識的角度來說那個2字確實是與車牌邊緣相連的,除非去重拍照片,否則那個2字就完全沒救!以一般人的角度來看此事是不是很蠢?小學生也看得到那個2啊?怎麼專家用電腦程式反而看不到?如果影像辨識專家就這麼笨,只能抱著課本去當教授了!

我當然不會坐以待斃,或只是將責任怪到硬體上去!其實人的腦袋會怎麼處理這個問題呢?還不就是遮住車牌下邊緣以下的部分,只看與同排其他972三個字的高度範圍,2字不就清清楚楚地擺在那邊嗎?如果要配合原來的程序,我只要在二值化的黑白圖上,對齊下排可辨識的972三個字的下緣切上一刀,把字元2和背景切開,如下面的連環圖,辨識就成功了!

有看到開刀的疤痕嗎?其實我在車牌上緣以及兩排字中間也同樣劃了一刀!這種侵入式療法的風險是切到不該切的地方,所以「開刀」的條件必須很嚴格,沒有必要或不確定劃刀的位置對不對?那就寧可不要隨便動刀。譬如台灣車牌的字元與車牌下邊緣距離比較大,根本不會生這種病,當然就不會有這種演算法,這是為香港車牌特製的!

有效嗎?如果沒這種手術,下面這張也是死棋無解的!在目前有限的約百張影像中,這個方法就救回了三四張原本無法辨識的照片,那可是好幾趴的辨識率啊!

也許有人會說:這種「病」用垂直方向的銳利化也可以處理啊?別小看我,這些我都知道也都試過!首先是全圖銳利化運算會浪費很多時間,而且絕大多數的情況並不需要作銳利化,好像為了致死率極低的一種病,逼著全民打疫苗一樣!而且銳利化沒有針對性的話,產生的副作用還可能讓原本相連的字元變成破碎!那是愚蠢的點子。相對的,我設計的演算法只作必要時的補救之用,沒事不會亂開刀,以免浪費時間或誤傷正常目標。

這些就是我天天研發的內容,看起來應該跟影像辨識論文感覺不太一樣,但卻是踏踏實實可以解決實務問題的演算法研究。理論上,只要影像拍得很清楚,大家按照論文或書上的方法做軟體,辨識率一定都是百分之百。但是天有不測風雲,影像品質不會永遠完美,加上車牌設計上面的一點點不理想,各國車牌都會「生病」!而且生的病都不太一樣!

如果我忽略這些病不去醫治,我的軟體辨識率就會只有九成出頭,就跟一般大學研究的車牌辨識水準差不多。但我的車牌辨識軟體辨識率好到動輒超過99%!原因就是我研究台灣車牌容易生的疾病很多年了!多數疾病我都有辦法醫治,還很少產生副作用。這些軟體如果直接移植到國外的結果會是如何?那些台灣人常吃的藥,其實外國人沒那種病,應該不必吃,吃了反而會肚子痛!

所以啦!我至少需要幾個月研究香港車牌容易生甚麼病?這些常見疾病我必須研究出效果好副作用又最少的演算法去應對,我不知道其他崇尚機器學習的大師是如何做影像辨識研究的?我自己確實就是這樣一步一腳印在作的!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:教育學習

限會員,要發表迴響,請先登入