Contents ...
udn網路城邦
人的智慧高深莫測,這樣一個小聰明就可以整死我了!
2022/06/07 06:37
瀏覽1,075
迴響0
推薦6
引用0

這應該是一個極容易辨識的案例,貨櫃碼當然辨識無誤!TCLU 142947 2,但是如果我還想同時辨識出貨櫃種類的22G1就出現麻煩了!我目前的辨識答案中是「無法辨識」出22G1的?怎麼會無法辨識呢?明明這麼清楚?這就讓我超尷尬了!我當然必須讓它變成可以辨識,不然會被客戶罵死的!但是真的好麻煩。

原因就是正負片辨識的問題了!在OCR的辨識邏輯中,二值化是必要的步驟,把目標搞成白底黑字或黑底白字來切割目標是必然的過程,如下就是兩種正負片二值化的結果:

大家可以看到,貨櫃碼TCLU 142947 222G1無法在同一程序中同時成為可辨識的目標!所以雖然我一定可以「分別」「粹取」出兩組目標,但是要將它們組織成一組完整的數據就好麻煩!要在正負片兩種程序中分別辨識出它們,接下來要用位置相關性判斷它們其實是同一組目標的一部份!好麻煩的!

很微妙的是:人眼要做這種判斷一點都不吃力!不管正片負片我們都可以很快認知到那是甚麼字?再根據相對位置判斷是不是同一組數據!我們是做AI的嘛!研發的低標其實就是不能比一般人的智慧笨太多前的OCR演算法確實還遠不如人的腦袋聰明!以此例來說,我知道程式一定可以模擬出跟人認知判斷一樣的結果,但是其實過程不太容易,這就是我每天上班的工作了!現在的AI就可以比人聰明嗎?那是詐騙集團才會說的!我是一定不敢這麼騙人的!

重點是我被迫正負片目標都要辨識,必要時必須同時參考兩者辨識出來的目標字元!程式有得改了!經過一番努力結果如下:

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:不分類

限會員,要發表迴響,請先登入