我的日常生活就是在研究如何做出更聰明,也就是更「AI」的影像辨識技術!但是我也一再強調:我的AI與大家以為的機器學習(ML)、深度學習(DL)或類神經網路(CNN),甚至Python語言等等是毫無關係的!感覺似乎有點寂寞?跟網路上看到的其他影像辨識專家或玩家做的事情都不一樣?好像一個中醫老師傅跑進了一個西醫辦的國際研討會?
這個情境是有點突兀,但是我非常享受我知道自己的每一個研究步驟在做甚麼?每個新增的演算法都是建立在真實世界的物理現象與原理之上!比起使用機器學習的人根本無法掌握自己的軟體是如何執行辨識的過程細節,我的日子過得踏實多了!事實上我的研究成果進度也會比他們快很多倍!他們始終在不確定的情境下嘗試錯誤摸索答案,很辛苦也很可憐的!
譬如上面的例子,我用OCR的方法找貨櫃碼,很顯然被那根固定桿產生的雜訊干擾了!我想要找11個成排的目標,但是固定桿跨越貨櫃碼中間,還不巧產生了一個跟字元大小近似的陰影目標,我的OCR就誤以為它也是一個字,辨識邏輯就全亂了!答案當然就錯了!
怎麼辦呢?所謂事出必有因!出事了想解決問題當然要先找到原因,所以我就會「重返犯罪現場」找原因!這是我很喜歡看的警匪偵探影集,他們想破案也是會一路追查線索,如果假設的案情嫌犯與證據互相矛盾時,就會再回頭到犯罪的現場試圖找到更多的證據!我也是一樣的!
不同的是他們只能證明是誰殺了人!我則可以修改就程式或增加新程式,防範於未然,讓罪案根本不會發生!所以我的工作好玩多了!譬如上例我可以找到那個雜訊與真正字元之間明顯不同的物理特徵,譬如顏色或對比度高低等等!如果只有雜訊目標明顯與眾不同,我就是「找碴」成功了!據此理由把它剔除,就可以得到正確結果了!
所以我常說我的影像辨識理念很像警察辦案,也很像醫生治病!按照SOP可以解決的問題就不必研究了!我的日常工作就是要搞清楚那些辨識錯誤或根本無法辨識的案例到底是怎麼了?研究清楚問題也設計出解決問題的演算法就算是向視覺智慧更邁近了一步,也就是更「AI」更接近「人工智慧」了!
所以不要繼續被AI詐騙集團唬弄了!AI或不AI的重點永遠不是使用甚麼技術?而是你做的事情可以如何接近真實智慧的程度!以影像辨識來說,目前我的技術確實是比ML、DL與CNN更加AI的!我也願意接受任何技術的挑戰!在我眼中ML、DL與CNN已經是手下敗將,也不可能翻身了!堅持繼續緊抱著ML、DL與CNN作影像辨識只是飲鴆止渴擴大災情而已!
限會員,要發表迴響,請先登入