人的智慧高深莫測,這樣一個小聰明就可以整死我了!
2022/06/07 06:37
瀏覽1,183
迴響0
推薦6
引用0
這應該是一個極容易辨識的案例,貨櫃碼當然辨識無誤!TCLU 142947 2,但是如果我還想同時辨識出貨櫃種類的22G1就出現麻煩了!我目前的辨識答案中是「無法辨識」出22G1的?怎麼會無法辨識呢?明明這麼清楚?這就讓我超尷尬了!我當然必須讓它變成可以辨識,不然會被客戶罵死的!但是真的好麻煩。
原因就是正負片辨識的問題了!在OCR的辨識邏輯中,二值化是必要的步驟,把目標搞成白底黑字或黑底白字來切割目標是必然的過程,如下就是兩種正負片二值化的結果:
大家可以看到,貨櫃碼TCLU 142947 2與22G1無法在同一程序中同時成為可辨識的目標!所以雖然我一定可以「分別」「粹取」出兩組目標,但是要將它們組織成一組完整的數據就好麻煩!要在正負片兩種程序中分別辨識出它們,接下來要用位置相關性判斷它們其實是同一組目標的一部份!好麻煩的!
很微妙的是:人眼要做這種判斷一點都不吃力!不管正片負片我們都可以很快認知到那是甚麼字?再根據相對位置判斷是不是同一組數據!我們是做AI的嘛!研發的低標其實就是不能比一般人的智慧笨太多!目前的OCR演算法確實還遠不如人的腦袋聰明!以此例來說,我知道程式一定可以模擬出跟人認知判斷一樣的結果,但是其實過程不太容易,這就是我每天上班的工作了!現在的AI就可以比人聰明嗎?那是詐騙集團才會說的!我是一定不敢這麼騙人的!
重點是我被迫正負片目標都要辨識,必要時必須同時參考兩者辨識出來的目標字元!程式有得改了!經過一番努力結果如下:
你可能會有興趣的文章:
限會員,要發表迴響,請先登入