Contents ...
udn網路城邦
為什麼有了免費的OCR軟體,客戶還需要我們?
2020/06/18 06:28
瀏覽2,291
迴響0
推薦5
引用0

所謂的OCR全稱是:Optical Character Recognition,中文翻譯是「光學字元辨識」,白話文就是從文件影像中辨識出字元啦!如果你想要將掃描文件作文字編輯處理,照著影像重新打字當然感覺很蠢,OCR就是幫你作這種事情的技術。像下面這個「影像」,你無法複製「文字」貼上到記事本,但你用免費的OCR軟體絕對可以正確辨識成對應的文字!

用網路搜尋一下「OCR軟體」就會發現很多中英文都可以辨識的免費軟體,連手機APP都有!但還是會有客戶來詢問我們可不可以作同樣的事情?為什麼?他們自己不會Google下載免費軟體嗎?他們甚至說已經找了幾個聲稱可以作OCR的技術廠商,但是辨識率都不夠好,「很不得已」才找到我們想把死馬當活馬醫的!

沒錯!OCR只是一個特定目標影像辨識的概念,整個流程還是需要用灰階二值化等技術,先簡化影像,找到可能是字元的目標,再與資料庫中的字模比對辨識出是甚麼字?如果字元影像非常清晰當然沒問題,但是真實世界中的影像不會像電腦螢幕截圖一樣完美,譬如客戶提供的紙本掃描影像大概是這樣的:

對於大多數的OCR軟體來說這已經太「複雜」了!原因是它們的辨識流程前半段不夠聰明,光是表格線對於它們來說就是嚴重干擾,會誤導它們的辨識邏輯,再加上掃描後的影像可能會歪斜、模糊,甚至有髒汙、雜點、陰影、浮水印或背景圖案等等,同一文件上的字都可能有各種顏色與反白的負片字元。

如果不能聰明的分離出目標與背景雜訊,正確找到應該被辨識的字元,強迫辨識很多不應該被辨識的圖案雜訊,或漏掉應該辨識的字,整體辨識率當然就會不好了!甚至會在辨識前段,OCR軟體覺得影像過於複雜處理不來,就決定放棄不辨識了!反正作出來也不能看,一定很亂!不如直接顯示無法辨識吧?影像處理不是一般OCR軟體的強項,可以辨識很多字才是主要功能。

大家想像一下!我們最擅長的車牌辨識是不是就是一種極端困難的OCR技術?像下面這種影像,我們就是要找出其實不太明顯的車牌字元,而且以我們現在的技術,真的可以找到它們並正確辨識出來!和一般的OCR軟體比較,我們影像辨識的前半段,找到字元的能力遠勝於這些OCR軟體,但是我們的目標字元只有幾十個字,就是特定字型的英數字,精確的說是兩種字型72個字模。

所以我們的車牌辨識或專案辨識的軟體,都是直接將幾十個字模的資料寫進程式碼中,根本沒有額外獨立的資料庫檔案!這樣很有效率,但也表示我們可以辨識的字元(或圖案目標)其實非常少。一般可以辨識中英文的OCR軟體,資料庫裡面至少有幾千甚至幾萬個字模!這是我們絕對無法望其項背的部分。所以顧客如果要我們提供一個兩全其美的OCR軟體,我們就必須整合既有的OCR

高品質的OCR其實就是可以辨識很多字與字型的軟體,是要逐年付出高價授權費的!我們當然不想封裝這種軟體給自己找麻煩,當過路財神幫國外公司收過路費。如果是免費軟體呢?各位想想,他們免費提供軟體想撈的是甚麼好處?不過就是廣告效益,他們會願意讓我封裝到我賣的軟體中嗎?即使我們作得到也是占人便宜不厚道的行為,我不會作的!除非該公司與我們正式簽約合作,推出產品。

所以昨天上午第一次會議我與RD討論的結果是不想作這個案子的!但是午休時間我忍不住作了這個實驗,嘗試找出上述文件的字元目標!

其實我們可以很快速準確地找出所有字元,找出字元目標後,還可以在個別的字元區域內作更精確的二值化,讓略為模糊的筆劃變得清晰,再將處理過的字元小影像貼回空白的大圖上,這種經過處理只剩下清晰字元的影像丟到一般的OCR軟體不就可以大大提高辨識率了?其實幾年前我們就幫精益科技公司作過類似的事情了!

簡單說,如果我們跟客戶談的是製作一個獨立的OCR前處理軟體,那麼這個生意就可以作了!如果這種辨識掃描文件的市場需求夠大,短期內OCR軟體不會或不想快速進化到跟我們找到字元的能力那麼強,這個軟體甚至可以商品化!好辨識的影像直接用OCR,不好辨識的就先上我們的先修班,再進入一般的OCR軟體,辨識率當然就會很高了!

我們希望用技術賺錢,但不想利用資訊的不對等賺到不合理的錢!譬如可能真的有些客戶是不知道有免費的OCR可以用,我不會裝傻讓他們花錢跟我買!即使他們知道有免費軟體,用過之後發現辨識率不好才找我,我也會用我的影像辨識專業知識,設法解析可能辨識不好的原因,如果是他們可以自行調整的,也不需要花錢跟我買東西。

最後如果他們真的需要我們寫軟體,我也會盡量解釋我們將進行的工作內容,以及我們為何可以作到的實績保證!就是讓客戶知道他們花的錢是不是合理值得?是不是很有保障?絕對不會賣弄玄虛,用甚麼人工智慧機器學習之類含糊抽象名詞唬弄客戶,卻又拿不出實績證明自己神奇的「AI」技術曾經完成過類似的工作?

須知:機器學習開發出來的影像辨識產品還是非常稀有的!成效如何其實都還未經市場充分檢驗比較,所以千萬別輕易相信只要說使用AI的廠商就有大神庇佑了!這樣很容易上當受騙的!一定要追問他們是否成功做過甚麼類似的事情!如果沒有,你就知道風險很大了!可以直接大砍價或掉頭離去,不必客氣!我自己沒把握的工作就根本不會接,即使客戶信任拜託我們作,也不會亂開高價的!就是收個合理的研發工錢而已。

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入