Contents ...
udn網路城邦
這比辨識車牌難很多
2018/02/09 05:20
瀏覽949
迴響0
推薦8
引用0

有客戶來信詢問能否替他們開發一個貨品陳列管理的系統,裡面關鍵的步驟當然就是用影像辨識貨架上的貨品,我不用幾秒鐘評估就立即回絕了!其實這就是現在大家常常提到的無人商店中很重要的一項功能:用影像看貨架上的貨物!我不看好無人商店的原因就在這裡,因為這是非常困難的影像辨識,以目前的科技水準,即使能作,影像辨識研發運算或周邊配合機制的成本也會高得嚇人!

你可以自己試試看用眼睛一一辨識清點上述貨架上的貨品,影像稍不清楚的,連人眼都很難辨識,如果不是你很熟悉的牌子,你還得想一想該貨品包裝的特徵,不能認錯牌子!而且我們人看東西時,絕對不是只用一個影像!看不清楚某件物品時,就會湊近一點或換個角度去看。那為什麼你會認為用單一影像就可以一次將所有貨品都看得很真切呢?這個調整視角位置的動作就包含了人的智慧判斷,所以即使你用攝影機從左到右拍一段影片來辨識也很難模擬。

或許有人會說:鄉下老師你不是可以在道路影像上一次辨識很多個車牌嗎?但是當有人問我:能否辨識有幾輛車?時,我通常是說我不能的!我可以依據我辨識出幾個車牌「推算」出可能有幾輛車,但如果某車的視角看不到車牌我就很難確定它的存在!

小小車牌可以正確辨識,大大的車子有幾台我反而不能辨識?是不是有點奇怪?道理很簡單!影像辨識必須知道目標的特徵特性,而且這些特徵特性必須可以用亮度或顏色明確的加以定義。車牌可以!但是車子呢?車子的顏色甚麼都有,車子所在背景的顏色亮度也沒有任何限制,作影像辨識的資料就是顏色亮度,目標與背景的顏色亮度都沒有明確的定義,我怎麼會知道哪一部份是車子?哪部分是背景呢?上面貨架上的香菸它們自己就五顏六色,比車子在馬路上還難辨識!

或許又有人會說:每個商品都有固定已知的包裝或LOGO,一一比對搜尋不就好了嗎?但是你知道畫面中每包香菸的大小嗎?如果你連香菸在哪裡的輪廓都切不出來,你怎麼知道香菸多大包?要比對標準LOGO圖案時,我應該縮小還是放大呢?甚至如果貨品有反光或因為明暗產生色差,比對圖案有多難多不可靠你知道嗎?而且,人家無人商店的貨架與攝影機基本上位置都是固定的,這位客戶要的可是「手拍」的影像辨識,難度更是超過無人商店許多!

我其實是相信這些困難一定可以克服的!因為我們一般人的眼睛與大腦合作都可以做到一樣的判斷,那其中必然有一定的邏輯與解決方案在每個人的「智慧」之中!只是這些微妙複雜的「思考」程序我們還沒解析掌握得很好,需要研究AI的專家們再研究個幾十年!我預計自己沒這麼長命,所以必定只作「簡單」的影像辨識!應該會長達幾十年的研究當然不是我會選擇涉入的議題,就讓Amazon之類的大公司去奮鬥吧!不然我會先將自己餓死,或被客戶罵死的!

有誰推薦more
全站分類:心情隨筆 工作職場
自訂分類:教育學習

限會員,要發表迴響,請先登入