
上面的案例很有趣,對於想做出正確辨識的人來說則是很不幸!一個不知道是意外或人為的刮痕,剛好切斷了R字的右腳,二值化之後就會讓R字完全像個P了!所謂的影像辨識目標就是:極盡一切手段,讓辨識結果與事實相符!上例的事實就是正確的車牌字元是R而不是P!我們必須找出合乎邏輯的程序做出判斷:這是個R而不是P!
上面狀況的疾病起因診斷與醫治方式設計都不會太難,就是在二值化之後,必須檢視每個我們初步認定的字,如上例P的矩形範圍內有沒有明顯的碎片?如果有,拼合之後會不會更接近另一個字?如上例的R?如果整體相似度與原本以為的P很接近,那就應該當作是R而不是P了!一小塊意外的髒污是很難讓拼合後的目標與某字元符合度很高的!這是常識!
我的影像辨識軟體確實就是這麼作的!所以即使偶爾會判斷錯誤,也不會讓客戶很錯愕!因為我已經盡量以一般人的視覺判斷為師!我的軟體程式或許複雜,但絕不神秘!客戶只會笑笑說:「這個狀況我也很可能看錯!」這就是所謂的「科技始終來自於人性」的新解了!我的軟體很少讓客戶覺得難以理解的!
這就是我作影像辨識研究的基本理念!我覺得是非常合理,非常科學,也非常人性化的思考模式,就是我認為的AI啦!但是現在流行的AI呢?在大家心急想找到捷徑的心態下,都被機器學習派誤導甚至綁架了!他們絕對不會談類似上面的這種個案細節!只會讓大家相信只要資料夠多,電腦算力充裕,機器就可以自己學會任何的智慧?
這很像有間醫院,標榜他們不需要醫學,不需要專業醫生,只要有充足的病歷資料讓電腦自動學習,就可以自動產生最好的藥方與療程,就能治好所有的病!如果現實世界中出現這種醫院,你會怎麼想?你敢去這種醫院看病嗎?怎麼看都覺得比較像詐騙集團,而不是可以信賴的醫療機構嘛!
但是很詭異的!現實上ML、DL與CNN等演算法所形成的AI產業鏈,就是已經如此大張旗鼓地霸佔了影像辨識領域的舞台!何以致之?我覺得就是大家太期待AI,卻又不耐煩像前面幾百年的科學家一樣穩紮穩打,好好地逐步研究真正的科學事實與原理!每個人都期待自己能參與AI的研發,但是都不耐煩好好讀書踏實做研究的意思!
另一方面,AI畢竟是一個可以賺錢的產業,而且還沒成熟到真的完全靠AI產生的實質效益賺錢的成熟階段!很多人都在濫用「人們以為的AI期望」賺錢!炒作ML、DL與CNN的神效,就能大幅提高算力的需求,電腦硬體業就賺翻了!加上ML等技術是較新的技術,軟體業也可以趁勢推出很多工具軟體與教材課程大賺錢!但真正用這些技術做出來的賺錢AI影像辨識軟體幾希?非常少到會讓我這個業者都找不到的!
我們終究必須面對:「AI是不是真的可以在真實世界產生經濟效益」的考驗!效率不高或成本太高的AI,終究會經不起考驗泡沫化的!我認為以ML、DL與CNN建構的影像辨識,就屬於必定會失敗崩潰的AI類型!統計學為基礎的技術基本上就不是精確的科學!但影像辨識必須是高精確高準度的應用軟體!怎麼可能成功呢?我現在就是以承接ML、DL與CNN的失敗案例過活的!還非常忙碌成功,又不必大量投資GPU電腦!所以我真的是靠AI影像辨識的合理效益賺錢的!
信不信我的說法?你自己判斷!我只是分享我自己實際工作的經驗!十年來我始終沒有跟隨主流派的腳步使用ML、DL與CNN等技術開發產品,但是我的產品研發勢如破竹,一直做得很好!還越來越好!預期的ML、DL與CNN的強力競爭對手產品卻始終沒有出現?歷史一定會證明我是對的!絕對無庸置疑!
限會員,要發表迴響,請先登入















