Contents ...
udn網路城邦
字元正確切割的技術是OCR能走得更遠的關鍵!
2026/01/04 05:38
瀏覽139
迴響0
推薦3
引用0

OCR技術在CNNDL出現之後就開始被嚴重低估,甚至摒棄不用了?這是絕對不必要也沒道理的!因為OCR始終是一個追求精準分析與解決影像辨識問題的好技術!相對的,CNNDL卻是先天就不求精確理解問題的統計學基礎的技術!當OCR有缺點或限制時,我們可以繼續研究細節精進突破,CNNDL則只能靠更多資料找機率更高一點點的解方,跟沒中獎就買更多彩券一樣愚蠢!

CNNDL可以不問原因只依據資料的「正確答案」逆推出某種程度正確的辨識過程,但是因為不是真的面對問題去分析,根據科學去設計針對性的演算法,所以雖然可以不知而行的很快達到「大概」對的狀態,但是永遠無法真的達到精確的領與範圍,對於總是希望辨識率百分之百的影像辨識而言,他們是「理論上」就不該採用的,完全沒有希望達標的演算模式!

相對的,我善用的OCR方法,碰到字元嚴重沾連時,確實會產生一個很大的障礙!如上例就是6788四個數字在原圖中,因為解析度不夠還有高度的側視角度,所以四字是無法分割的一個相連目標!但是大家可以看到我的影像處理過程,可以運用很多相關的資訊,最終成功的將四胞胎連體嬰也正確切割,可以完全正確辨識了!這些進階的OCR技術已經能讓我辨識出人眼視覺邊緣的困難案例了!

過程細節太繁瑣我不便在此詳述,但是我已經在我的產品中證明我可以用OCR做到這麼困難複雜的辨識,也證明OCR絕對是可以繼續進步解決更多辨識問題的好技術!所以千萬不要在低估OCR了!反而應該嚴肅思考與檢驗CNNDL的實用性!甚至理論上的可用性!真實市場上已經實用通用的影像辨識產品,OCR技術為基礎的仍是絕大多數!即使DL已經被推崇炒作那麼多年了!情況還是一樣的!

有誰推薦more

限會員,要發表迴響,請先登入