Contents ...
udn網路城邦
一個都不能少?影像辨識也用到我的教育理念了!
2025/12/12 09:52
瀏覽496
迴響0
推薦19
引用0

這是我們目前進行中的研發專案,和我們之前做的專案都大不相同!深入之後也發現難度極高,絕對是開業以來最困難的案子了!如車牌或考卷是辨識影像中相對清晰對比度較高的目標,工地揚塵雖然不是清晰目標,但是有半透明的物理特性,抓到重點發明針對的演算法後我們也快速達標了!

但是箱子的邊緣與軸線不保證是在影像中相對明顯的目標,雖然誰都可以很容易的認出箱子的邊緣與範圍,但是其實這是非常複雜的物理認知過程!因為箱子本身會有印刷文字圖案與膠帶貼紙等等雜訊干擾,箱子外部的背景更是甚麼狀況都有可能!

我們必須要「循序」辨識出所有重要的軸線或邊線,最後構成一個完整的箱子輪廓才算完整答案!過程中任何一個轉折點因為雜訊干擾產生錯誤,就絕對不可能獲得正確答案了!就好像一個法令過度嚴苛的國度,任何交通違規都會被判死刑,這個國家的活人就不多了!

但是這個描繪輪廓的過程實在太長太複雜還充滿雜訊,即使我們建立了很多量化指標來做評估,也無法保證每一個轉折點都是可達到遠端最終點的唯一正解!功虧一簣的狀況太多了!所以有一陣子感覺受困了!雖然實作的人是我的RD,但是我也像是一個認真指導研究生的教授,我們每周都線上會議討論不只一次!

不久前我提出了一個新的觀點方向,就是不再堅持每一個轉折點都要選出唯一的最佳答案!而是符合門檻的可能答案都給它們機會繼續走下去!就是碰到岔路就派多一個人分頭走下去的意思!最終就會出現多個完整輪廓,如上圖所示!這些輪廓只要包括符合視覺判斷的正確答案,我們就有機會挑選出正解了!

這樣當然成功的機會就會變多了!等到我們可以讓絕大部分案例都在多選答案中包含正解,接下來用這些完整的答案建立新的量化指標,譬如箱內箱外的特徵差異與輪廓的形狀或大小等等,應該就可以選出正解了!實在還是無法判斷時還可以用與該影像無關的經驗值做猜測,選一個最像常見的紙箱形狀的答案之類的!

當我在線上跟客戶的總經理說明時,忽然想到這跟我在後段班大學任教的心態有雷同之處!我面對的學生當然都是成績不好,或態度不夠認真才會到我的學校報到的!很像在人生路程上有個指標已經表現不好,如果我繼續在他們之中挑三揀四,結果當然是好學生越來越少!最後都被我淘汰放棄光光了!

所以我的態度是盡量給他們機會前進學習,讓他們盡量有機會走得更遠!這樣最終成功的人數與機會就一定會變多了!死馬當活馬醫有時候也會救活幾隻的嘛!我的RD不就是最佳範例?考大學時的成績連國立大學都上不了?但是我沒放棄她,她也沒有放棄自己,就這樣一路走來現在比台大資工博士都更管用了!我的這個點子告訴她,我認為是相當複雜的!但她不到一周的時間就大改版成功了!

所以啦!影像辨識也隱含著深奧的人生智慧的!把這麼有趣的工作交給機器學習去瞎掰鬼混?實在太浪費人生了!我思故我在,多動腦筋好好做研究吧!

有誰推薦more

限會員,要發表迴響,請先登入