即使影像模糊，掌握蛛絲馬跡，也有可能會破案的！ - 鄉下老師

Contents ...

即使影像模糊，掌握蛛絲馬跡，也有可能會破案的！

2023/06/20 15:29

迴響0

推薦5

引用0

看到這種辨識能力，即使我完全不用機器學習(ML)、深度學習(DL)與類神經網路(CNN)等當紅技術，你敢說我的影像辨識不夠AI嗎？事實上是那些技術根本無法達到我的境界！學過ML、DL與CNN的人可以想像一下，如此極端變形加上相當模糊的影像，你需要多少資料？多少時間？才能讓機器經過「經驗統計」的過程學會呢？應該是會「訓練」到海枯石爛吧？

這讓我想起我當年英文忽然開竅變得很厲害的經驗，從國中到高三上學期我的英文成績都是很差的！建中的前兩年半成績都在及格邊緣，但不是我不用功，我跟所有同學一樣很用功，也跟大部分同學一樣成績不好。我們當時信奉的學習方式跟機器學習類似，就是拼命背單字、文法、句型，甚至課文等等，相信只要「訓練」量夠多了，英文自然就會好了！

但是鐵杵沒有磨成繡花針，我高三下的第一次模擬考是淒慘到極點的28分！那是我讀書歷史上的最低分！我非常受傷，但也開始覺得必須有所改變，我最納悶的是我的國文好得很，英文也是一種語文，為何我的表現卻完全相反？如果我用理解與學習中文的方式學英文呢？

我看中文時當然不會執著於單字、句型或文法，而是直接理解(或猜測)那段話想表達的「意思」！任何語言文章當然都是有目的而寫或說的！如果我先跳脫幾個不認識的單字，不太懂的句型，直接去理解那個題目，或那段話想表達的主題意義，然後才考慮我不太確定的單字句型等等，會怎麼樣呢？

結果就是我一個半月之後第二次模擬考成績是72分，好像沒甚麼？但那可是全校的第八名欸！我的成績好到可以考外文系了！而且不是曇花一現，我從此英文就一直都很厲害了！所謂事出必有因，如果你總是可以理解問題，專注在為何有那段話？那句英文？它的主要意義、情緒與目的是甚麼？你就可以很快看懂掌握英文了！只要看懂八成的字就一定可以掌握文意了！

所以地毯式的先看每一個英文字認不認識？就跟機器學習或CNN的概念相似，還不知道主旨目的就拼命收集資料，Data Driven嘛！資料本身才是老大，至於我要辨識的最終目標呢？待會再說！我作影像辨識的概念就很不一樣，我也會先收集全圖資料，但是從一開始我就會專注在我想辨識的目標，如果估計與達到目標無關的程序或資料我就會盡量簡化、省略或忽略！

如上圖，其實二值化之後那些字元目標還是很破碎的！但是我知道我要的東西是甚麼？排除根本完全不像的，剩下「有點像」的就繼續設法加強處理，硬挖硬抝也要找到車牌，還要把它扭正。不清楚嗎？回頭找原始的RGB資料，在局部已知應該是車牌的區域再做一次精細的二值化，答案就出來了！

總之，影像辨識應該像是解一個困難的物理或數學習題，你應該完全理解並掌握狀況，知道下一步該怎麼作？為何要那麼做？想靠大量嘗試運算「踹」出答案？那是非常沒有效率的策略。就跟當初我曾以為想學好英文就是多讀書多背書就行了！事實絕對不會是這樣的！我高三英文開竅之後根本沒有再為了「學英文」讀過甚麼英文書，但是一輩子都沒再被英文困擾過了！任何英文考試不必準備都是非常高分！