Contents ...
udn網路城邦
紙箱材積的辨識應該是我們最深入視覺智慧的研究了
2026/01/18 03:21
瀏覽142
迴響0
推薦5
引用0

這是我們進行中的紙箱材積辨識專案報告的一角,這個案子非常困難,但也非常有趣,雖然我們已經比預定的四個月結案期延誤了,但客戶方自行研發這種技術已經好幾年了!自覺已經達到他們的技術極限,但辨識率仍不太滿意,才會找到我們的!只要我們的研發確實有提升突破他們的天花板,他們就覺得值得期待了!所以我們會每週提出進度報告,證明我們確實還在努力中。

一個上面可能有任何印刷內容,任何貼紙膠帶的紙箱,放在毫無限制的任何背景環境中,都要能正確辨識出箱子的輪廓?這真的已經進入人類視覺認知能力的深處了!我們當然是先從明確可以量化的點與線特徵與物理條件限制入手,但是依賴任何單一量化特徵都無法直接達到高辨識率的目標,所以我們想鎖定的「特徵」,也從點與線推進到面與區域的特徵了!

簡單說,就是我們只依據點與線的特徵可以找到的完整輪廓答案其實有很多可能,之前是希望在辨識整個輪廓的過程中總是可以依據某些點線特徵直接找到那個物理上正確的唯一解答!我們找到的點與線段特徵其實已經比客戶之前的研究更多更精密了!但是整個追跡過程差之毫釐失之千里,只要一個轉角錯誤就不會到達正確終點了!所以辨識率提升還是有限。

但是我們沒有因此就束手就擒,就像老鼠走迷宮吧?如果我們只有眼前的小範圍資訊與前面已走路徑的經驗時,幾乎不可能一次就完全走對,找到那條唯一正確的路徑與出口!但是數位遊戲就是可以嘗試錯誤反覆運算的!電腦遊戲通常沒有人第一次就能成功破關的,但是只要多玩幾次,累積與彙整足夠的經驗值之後,總是可以破關的!

所以如上圖我們依據點與線的資料可以產出很多可能的輪廓答案,只要唯一的正解有包括在這些可能達案之中,我們就算是已經有成功的機會了!一旦完整的輪廓形成,我們就可以整理出更多的綜合指標!從整個輪廓的綜合量化指標,而不是個別獨立的點線資訊評估這個答案對不對了!

譬如我們可以建立輪廓內外區域的特徵指標,箱內與箱外的顏色亮度應該是有差異的!又如整個輪廓的六條邊線與三個軸線,可能有的清晰有的模糊,但是整體來看正確的那組輪廓應該是每條線都相當清楚的!所以所有線段的整體清晰度也是一個綜合指標!我們在整合這些完整輪廓答案的數個綜合標之後,依據這些綜合指標選出答案的正確率當然就會更高了!

所以雖然距離完美的人類視覺智慧還有很大的努力空間,但是我們確實已經將委託單位之前研發的天花板極限明顯推高了!所以即使我們已經比原來合約的期限超時了!客戶還是給我們很大的支持與肯定,老闆還寄了一盒應該是日本進口的高級蘋果禮盒給我!我的RD應該也有吧?算是尾牙的抽獎禮物了!哈哈!

這個案子應該是我們入行之後最大的挑戰了!辨識邏輯已達到視覺認知哲學的層次!相對的具體程式的複雜度也達到前所未有的高度!RD當然非常辛苦努力,我也沒有閒著,每周都至少兩次跟她一起討論研究研發的方向,我想即使是最頂尖大學的影像辨識研究團隊,也未必有這個高度了!我們的工作真好玩!

有誰推薦more

限會員,要發表迴響,請先登入