Contents ...
udn網路城邦
我們辨識的不只是字元,而是整個影像!
2020/06/12 11:13
瀏覽721
迴響0
推薦9
引用0

我們公司不是只賣車牌辨識的!因為有完全自行研發的影像辨識技術,我們其實可以作各式各樣的影像辨識專案,尤其是與車牌辨識有點像的各類文件、燈號或產品上的打印的字元,也已經有很多實績了!這一點要請各位讀者幫我們多多宣傳推廣一下!

大家都知道影像辨識正夯,可以預期未來十年內會有多到不行的各種影像辨識軟體進入各種產業,協助提升所有工作的效率,我們就是準備迎接這個大海嘯的先頭部隊!我們自己是準備好了,但是發現多數客戶對於影像辨識的認識都還不夠,所以跟客戶溝通常常會變成很辛苦的影像辨識概論教學!

更糟的是,機器學習派誤導了很多大家對影像辨識的正確認識,他們一方面大肆宣傳他們的AI技術如何厲害!但是市場上卻根本找不到可以用機器學習方式順利實作出影像辨識產品的公司?以前還很擔心他們跑來搶生意,現在感覺他們根本是來亂的!把一般人的觀念都搞亂了,很多人現在都Training, Tuning的朗朗上口,卻根本買不到用機器學習技術作的影像辨識產品!我們的產品裡是完全沒這些東西的!

一般客戶最難理解的是:雖然如上例我們的目標是辨識字元,但是要走到這一步,「辨識環境」的工作其實比辨識目標還要複雜、繁重且重要!真實世界的影像如果都很完美,只有字元,背景都是單色乾淨的綠屏,大家就不需要我們了!只要下載一個GoogleAPP就可以辨識所有字了!

但是玩過那些免費辨識軟體的人都知道,背景環境一複雜起來,辨識率一定很差!即使你用高價買的OCR軟體,辨識各種環境中的字元時,也一樣很差!譬如很蠢的事實是:多數OCR軟體無法正確辨識表格中的字元!連直來直往的格線都會讓它們的辨識程序大亂!我們就幫OCR用戶寫過去除格線的程式!

所以大家誤會的是:以為辨識字元很難,如果我們幫忙他們搞定了,可以專案製作出高準確率辨識某種產品上字元的軟體給他們,日後如果目標字(或圖案)的辨識需求有變化時,他們只要匯入新的字型圖案,最多加一個Training的操作過程就可以繼續使用了?機器學習派都是這麼說的!但卻拿不出實際的產品給你看?你有錢都買不到!可能要到變形金剛來的賽柏坦星才有得賣!地球上目前還看不到!

好多客戶都會這樣要求我們提供自行匯入新目標圖案的功能,我們每次都覺得很尷尬!我們當然可以製作介面讓使用者自行更換字型或圖案,但是預期結果一定是辨識率大減,他們還是必須回來找我們處理的!我們作了程式介面當然還是要收錢的,但是這些工作對客戶應該沒用處,這筆錢一定是白花的!為什麼?

如前面那張圖中,某種產品上有很多三碼的英文字!在正確辨識出他們之前我們一定要寫好準確的程式「認出」哪些是環境目標?那些是我們必須辨識的目標?將兩者分清楚後再去比對字模或圖案的動作,其實是非常固定簡單的程序,根本沒有甚麼專業技術可言的!

那甚麼時候客戶會需要辨識不同的字型(或商標圖案)呢?有可能是完全一樣的產品與環境,只是字型改變嗎?當然不會!誰會蠢到在同一產品上印兩種英文字型呢?一定是他們要辨識另一環境中的另一種產品!如果環境變化時軟體可以很聰明的立即適應,那你下載的Google App就可以辨識任何背景中的文字了!我們這一行就沒必要存在了!

大家有看懂嗎?影像辨識一定是一個辨識整張圖的工作,如果目標是叢林中的兔子,抓到複雜背景中的兔子,甚至參考背景資訊協助我們鎖定兔子才是專業技術!如果有隻長得完全一樣的兔子,你以為寫好程式辨識它之後就可以放諸天下皆準?不論兔子躲在甚麼背景中都可以辨識?甚至直接換掉兔子圖案變成一隻狗也都可以辨識?完全不是這樣的!

如果機器學習派說可以這樣,你就請他們作出來賣給你!我是沒這麼厲害的!他們如果做得出來,或宣稱面對新環境,辨識軟體只要Training一下即可繼續使用?那現在影像辨識市場尚早就沒我的工作了!大家就別太天真上當了!那些宣傳廣告都是假的!騙你花錢去補習沒用課程的噱頭罷了!他們說的那種給些資料Training就可以辨識新目標的產品,地球上還沒有!可能要從外星人那邊買!

有誰推薦more

限會員,要發表迴響,請先登入