Contents ...
udn網路城邦
複雜的辨識必有合理的認知過程,沒有奇蹟只有技術手藝!
2021/07/27 08:15
瀏覽785
迴響0
推薦7
引用0

上面這個螺絲釘上,頭家交代有幾個特徵需要辨識出來:第一是外型是圓是方?第二是它可能有三或六條對稱等角度距離的輻射線,第三是它可能有些文數字的字串,但是字的方向不一定,可能朝內也可能朝外。我的任務用白話文簡略概述就是這樣!

怎麼作呢?如果我想畢其功於一役,想出一個完整的辨識流程,一次就將那麼多的任務通通完成,那我這個一個月前開始的任務可能還在原地踏步,閉關冥想看有沒有靈感?或是將責任推給客戶,說我要的一千張照片怎麼還沒拍給我?沒有巨量資料,我要怎麼開工讓機器學習呢?

如果我是這樣辦事的,可以想見我和客戶都會在壓力鍋中蒸煮煎熬好幾個月,甚至一年半載!對於這些事到底可不可以做到?可以做到如何的程度?好像太白星君的煉丹爐,不到七七四十九天開爐之前一無所知,真的開爐時也好像抽獎,根本不知道會發生甚麼奇蹟或災難?

這不是在說笑,這就是我的客戶曾經委託宣稱有AI技術的其他公司作影像辨識的實際經驗!歷經數年之久,他們想要的影像辨識能力還是零!他們早已能夠接受部分目標不能達成的結果,但是至少要部分達成吧?做不到的話,至少也要知道無法辨識的原因障礙是甚麼?看看接下來可以怎麼努力趨近目標嘛!但結果總是甚麼事都沒發生,只能看著他們的錢與計畫付諸流水!

我深深知道他們找我死馬當活馬醫的心情,也很想讓他們有完全不同的研發經驗與成果!以此例來說,接任務第一天就用二值化技術找出主要目標的輪廓,馬上告訴他們可以辨識外型了!漫漫長路距離終點依然遙遠,但我們已經確定到達第一個車站了!賓主的心情當然都不錯!

接下來一個禮拜,我專注於研究如何辨識那幾條輻射線,它們只會在特定的環狀區域出現,那就將那一部份切開來做環狀掃描,有輻射線的部分就很容易看出有訊號起伏了!當然那個區域裏面也會有背景雜訊或字元,但是不難與輻射狀的直線區分,所以設計一兩個偵測輻射線特徵的演算法,一周之內任何輻射線,即使很不清楚的都能辨識了!他們當然很愉快的簽發了我的月費支票。

接下來就是要找字元了!就像吃水果剝皮吧?我已經用主要目標的輪廓定位,也找出輻射線了,清除掉這些東西,即使字元多半模糊破碎,還是可以盡量拼湊出一個大概的!上面這張太模糊的JH我是辨識不出來啦,但是第一張影像中的WY目標就可以抓到了!

抓到目標不算成功,如果不能確定它的方向,還是無法比對知道是甚麼字的!此時就需要用到極座標幾何學做旋轉了,先假設它是頭朝外的轉正,再上下顛倒180度,都去對對字模,方向對的當然就符合度很高,WY就可以辨識成功了!

當然各種螺絲釘的狀況還是多不勝數,重點是不必每次都要等個七七四十九天才能開爐看機器學習的成效?也不必勞煩客戶拍幾千張照片,我只用幾十張樣本就可以做到很多事情,讓客戶放心了!長路依舊漫漫,但我們知道自己已經上路,每天都在穩步前進,可以辨識的東西越來越多了!

知道了嗎?影像辨識應該好像一個木工雕刻,你應該可以看到從原木到粗胚,到精雕,到著色上漆拋光,一座精美的佛像就會逐步在你眼前呈現的!絕對沒有甚麼神祕不可理解的神奇演算法,拿甚麼AI當作遮羞布或障眼法,能做就是能做,不行就是不行,我可以用任何人都聽得懂的白話文詳細解說!

我賣的比較像是木工師傅的好手藝,並不是甚麼神奇的靈藥?你如果喜歡這樣完成你的影像辨識研發,就來找我吧!我未必甚麼都會,但絕對可以讓你花的每一分錢都覺得很安心很值得,絕對不搞神祕騙人,童叟無欺的!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入