
看到這種辨識能力,即使我完全不用機器學習(ML)、深度學習(DL)與類神經網路(CNN)等當紅技術,你敢說我的影像辨識不夠AI嗎?事實上是那些技術根本無法達到我的境界!學過ML、DL與CNN的人可以想像一下,如此極端變形加上相當模糊的影像,你需要多少資料?多少時間?才能讓機器經過「經驗統計」的過程學會呢?應該是會「訓練」到海枯石爛吧?
這讓我想起我當年英文忽然開竅變得很厲害的經驗,從國中到高三上學期我的英文成績都是很差的!建中的前兩年半成績都在及格邊緣,但不是我不用功,我跟所有同學一樣很用功,也跟大部分同學一樣成績不好。我們當時信奉的學習方式跟機器學習類似,就是拼命背單字、文法、句型,甚至課文等等,相信只要「訓練」量夠多了,英文自然就會好了!
但是鐵杵沒有磨成繡花針,我高三下的第一次模擬考是淒慘到極點的28分!那是我讀書歷史上的最低分!我非常受傷,但也開始覺得必須有所改變,我最納悶的是我的國文好得很,英文也是一種語文,為何我的表現卻完全相反?如果我用理解與學習中文的方式學英文呢?
我看中文時當然不會執著於單字、句型或文法,而是直接理解(或猜測)那段話想表達的「意思」!任何語言文章當然都是有目的而寫或說的!如果我先跳脫幾個不認識的單字,不太懂的句型,直接去理解那個題目,或那段話想表達的主題意義,然後才考慮我不太確定的單字句型等等,會怎麼樣呢?
結果就是我一個半月之後第二次模擬考成績是72分,好像沒甚麼?但那可是全校的第八名欸!我的成績好到可以考外文系了!而且不是曇花一現,我從此英文就一直都很厲害了!所謂事出必有因,如果你總是可以理解問題,專注在為何有那段話?那句英文?它的主要意義、情緒與目的是甚麼?你就可以很快看懂掌握英文了!只要看懂八成的字就一定可以掌握文意了!
所以地毯式的先看每一個英文字認不認識?就跟機器學習或CNN的概念相似,還不知道主旨目的就拼命收集資料,Data Driven嘛!資料本身才是老大,至於我要辨識的最終目標呢?待會再說!我作影像辨識的概念就很不一樣,我也會先收集全圖資料,但是從一開始我就會專注在我想辨識的目標,如果估計與達到目標無關的程序或資料我就會盡量簡化、省略或忽略!

如上圖,其實二值化之後那些字元目標還是很破碎的!但是我知道我要的東西是甚麼?排除根本完全不像的,剩下「有點像」的就繼續設法加強處理,硬挖硬抝也要找到車牌,還要把它扭正。不清楚嗎?回頭找原始的RGB資料,在局部已知應該是車牌的區域再做一次精細的二值化,答案就出來了!
總之,影像辨識應該像是解一個困難的物理或數學習題,你應該完全理解並掌握狀況,知道下一步該怎麼作?為何要那麼做?想靠大量嘗試運算「踹」出答案?那是非常沒有效率的策略。就跟當初我曾以為想學好英文就是多讀書多背書就行了!事實絕對不會是這樣的!我高三英文開竅之後根本沒有再為了「學英文」讀過甚麼英文書,但是一輩子都沒再被英文困擾過了!任何英文考試不必準備都是非常高分!
限會員,要發表迴響,請先登入







