Contents ...
udn網路城邦
工地揚塵的影像辨識用CNN的方式作好嗎?簡直糟透了!
2024/02/23 05:57
瀏覽559
迴響0
推薦7
引用0

因應東北季風夾帶污染南市強化工地揚塵防制

過年前一家專做工地環保監測的公司前來詢問,我們能否設計出更有效且較低成本的工地揚塵路面髒汙的影像辨識系統?新聞中都報導有這種監測系統使用中了!為何還要如此費力用心地找到我們這個鄉下小公司來詢問呢?原因就是目前這種監測的準確率還不夠高,而且都是使用CNN(YOLO)等號稱AI的影像辨識,所以建置成本偏高,大概需要買輝達公司的晶片之類的吧?

我們聽完他們說明之前系統的運作原理之後,很快就覺得使用CNN的技術做這種辨識是一個很糟糕的選擇!從如上的新聞圖片中大家就可以體會到,右上方的藍色框框是影像辨識系統辨識到的揚塵區塊,要在如此複雜的背景中「看清楚」這麼模糊也沒有明顯輪廓的「目標」真的很難!比找車牌或貓狗都難多了!

須知CNN的辨識模式是在單一影像中找特徵來分析的!OCR的辨識技術也類似,只是OCR偏重於找封閉曲線輪廓的目標,CNN則是直接設計特徵矩陣做全圖搜尋!其實這兩種方式都非常不適合辨識揚塵!因為工地背景都超複雜的,揚塵卻是其中最模糊的特徵OCRCNN辨識的理念都是找到較明顯特徵的!

如果我們堅持用CNNOCR就表示我們必須先做複雜的影像前處理,建立完整的全圖特徵,再一一排除「不是」揚塵的其他目標之後才會抓到揚塵!因為揚塵是最不明顯最難明確定義的「特徵」嘛!這些工作在一般馬路或停車場影像上還比較好做,但是在甚麼東西都有,還很零亂的工地呢?當然是場災難!會耗費非常多的計算資源!

按照目前一般AI專家的思維模式,CNN既然「可行(算得出來)當然就義無反顧往前衝了!計算量太大嗎?那不是問題,就買超級電腦加裝超級晶片嘛!當然建置系統的成本就會偏高了!AI專家可能很得意自己完成了不可能的任務,但是最終要付錢購買設備建置系統的買主們可就欲哭無淚了!都是血汗錢啊?如果環保監測工程的利潤都讓AI產業吸血賺去了,工程單位不就只能喝西北風了?

簡單說,現在只要狹義的AI技術,就是ML、DL或CNN能做到的事情,AI專家們就絕對不會考慮其他傳統處理方式的可能性!就是為了「AI」而AI的意思了!我認為這是社會的集體AI失智症!我們公司沒有這種疫情,雖然是以OCR技術起家,要用CNN也可以,但影像辨識技術不是只有這兩個選擇!我們的AI概念是更廣義更靈活的!

大家記得侏儸紀公園電影中的經典橋段嗎?恐怖的暴龍已經跑到眼前了,恐龍專家就告訴小孩說:「不要動,牠就不會發現你了!」這是真的!很多掠食動物都只有敏銳的動態視覺,因為不會動的東西多半不是牠們需要找的食物!人類的視覺動靜皆宜,是因為我們的祖先必須分辨不會動的果實是不是成熟可食了?也必須看到草叢中埋伏不動準備偷襲我們的獅子老虎!我是古生物專家,這個我懂的!

大家有沒有想過?人的大腦中負責視覺的區域高達一半,按照身材比例在野外叢林中的動物腦袋都沒有人腦大,牠們每天日常看的叢林影像卻比我們文明生活中看到的影像更複雜!但是牠們一樣可以順利獵食,如果牠們的腦袋是跑CNNOCR等靜態辨識的話,一定還沒看清楚獵物目標就跑掉了!也就是說動態辨識需要處理的資訊少很多,連蒼蠅腦都可以及時反應躲開巴掌的!

所以暴龍的視覺主要是跑動態影像偵測的!就是連續的單張影像之中只有跟之前影像有差異(變化)的部分才會動用腦袋去處理!沒事就不要去管根本沒動作的影像資訊!我們的視覺其實大部分時候也是這樣運作的,所以假裝雕像的真人忽然動起來就會把你嚇死!因為在那之前你根本「沒看到他」!不動的背景影像不管多複雜都會被當作空白背景的!必須這樣那些動物較小的腦袋才會夠用嘛!面對數億年的生物演化成果,我們的AI科技還遠遠落後的!

以此觀點,如果我們用動態偵測的角度辨識揚塵,就會很簡單省事,我們根本不必做太多原圖特徵的分析處理,只要持續建立維護一個基本上不會動的背景影像,每個即時影像減掉這個背景,有變化的部分不管多模糊都會凸顯出來了!即使是最模糊的揚塵都會立即呈現!不必用很複雜大量的電腦運算,就不必一定要買特殊的高檔AI電腦,系統耗電也不大,也就是很省錢了!

運用這種技術的難度在於如何建立維護一個其實還是會慢慢變化的背景影像,這就要感謝林泓宏教授的博士論文了!我很早就會做動態偵測的演算,但很多細節穩定性與合理性掌握不佳,運算量方面也會太大,即使不做特徵辨識也要一直計算之前一段時間的影像疊加平均嘛!在林教授指導之後,現在這個演算法既穩定又很節省運算,就是我的客戶想要的便宜AI了!這個方法的數學架構並不簡單,但執行時的必須運算量很低,所以就是高技術也高效率的系統了!只有輝達公司會不爽了!

下面就是我們初步測試的一個事件影像了!跟CNN做出來最大的不同是我們沒有矩形特徵目標的假設,所以會直接呈現影像有明顯差異的資料點,可以更清楚揚塵的範圍!不會像CNN的成果,找出來的東西永遠只能用矩形的框框表達!蠻粗糙的!辨識車子貓狗還好,揚塵範圍用方框表示?太奇怪了!

AI所以會受到重視,應該是它可以幫助各個產業把事情做得更快更好更有效率,但是如ML、DL與CNN等所謂的熱門AI技術卻有一個大盲點!就是它們本身的運作方式就非常忽視「省錢」這件事!為了一定要使用這些「AI」技術才像是AI專家的迷思,結果就是很多人開著千萬超跑去登山涉水或載運粗重貨物,很多其他更好也就是更AI的選項都直接被忽視了!我認為為了AI而AI非常愚蠢,但我也將此AI亂象視為我的商機!

有誰推薦more

限會員,要發表迴響,請先登入