如果要我定義何謂AI技術?我會說是:「窮盡一切可用資訊讓電腦軟體判斷更正確的技術!」其中機器學習是可以統計複雜無序資料獲取機率的一種技術,只是可以幫助實現AI目標的眾多技術之一,還不是最重要或最精確的技術!如上這種狀況,字元掉漆是沒有規則的,也不會有夠多的這種隨機例外的資料可供學習訓練,讓機器學習製作的AI可以準確猜對那個破損的字元。
但如果你跳脫「影像」辨識的框架,回歸一個懂得貨櫃碼設計規則的「人」的角度,你是可以使用「推理」的方式正確猜出那個破損嚴重字元的!即使它掉漆掉到只剩下似乎有個字的殘跡,用人眼都難以判斷是甚麼字的程度時都行的!關鍵就是最後一字的檢核碼了!
在除了那個掉漆字之外的字元都可以準確辨識的前提下,我們只要用窮舉法,一一嘗試用0-9的字元來取代破損字,看看用哪一個字元組織出來的完整字串可以通過檢核碼的檢查?答案就出來了!而且根據檢核碼的公式,這是唯一解!在此例中它非是6不可!即使你用眼睛看或用字模比對都有比6字更像的選擇,譬如5或8或9!但檢核碼不會騙人的!即使你將那個字整個剷掉,我都能推算出它原本是個6!
上面這個例子就更有趣了!磨損髒污的是檢核碼本身!如果用眼睛看,我自己怎麼猜都覺得應該是個8字!但是事實擺在眼前,EISU111616每個字元都清晰可辨,拿這10個字算出來的檢核碼就是6!不是8!我應該相信誰呢?即使那個檢核碼其實是噴號碼時算錯的8,我都應該直接把它改成6的!因為那是規則上說必須如此的!正規號碼都確定清晰可辨時,你本來就可以不理會檢核碼是幾號的!
這就是我跟大多數作影像辨識的人不同之處!對我來說,影像辨識絕對不只是「影像」的辨識而已!而是一個窮盡所有環境資訊、物理原理與法規證據的綜合推理過程!這才是一個普通人用自己的眼睛與腦袋做「影像辨識」時真正的過程!如果我的軟體沒往這個方向設計,當然怎麼看都笨笨的!也就是很「不AI」了!
所以說到「影像」處理的技術,我沒有太多獨家神奇的密技,我也不用機器學習(ML)、深度學習(DL)或類神經網路(CNN),但是總能很快做出非常聰明且執行快速的影像辨識軟體!我的密技其實就是不自我設限,模仿所有一般人的視覺認知過程,努力將這些過程數學化與程式化而已!這比模仿人腦「神經反射」層級的運作當然更接近人類實用的智慧!
所以我的密技就是可以把很多一般人的常識邏輯很快改寫成準確有效的程式碼!可以在電腦上呈現出近似人類智慧的反應!情況類似我的「文筆」不錯!可以立即精準描述實況與表達想法一樣!在此寫程式就如同寫文章了!我實現AI的核心基礎是我的知識與推理能力,加上足夠的程式技巧,而不是碰運氣依賴資料統計靠機器自己摸索學習的!
這就是我認為的正確AI理念!而且我的公司已經如此實踐多年極具成效了!所以當我看到聽到很多人明示暗示的觀點:一定要跟ML、DL與CNN扯上關係的才能視為「AI」?就特別反感!見一次罵一次!也希望大家早日跳脫這個莫須有的桎梏,讓AI研發開大門走大路突飛猛進!反之,如果你相信ML、DL與CNN才是AI?只會很快陷入無法自拔的爛泥坑,哪裡也去不了!
限會員,要發表迴響,請先登入