Contents ...
udn網路城邦
統計學上得到的最好辨識流程還是不夠的!
2023/10/02 07:22
瀏覽568
迴響0
推薦5
引用0

昨天我的高中同學,目前在美國哥倫比亞大學醫學院,擔任醫學統計專家的甯又明博士專程到台南來看我!早上邀他一起去打球之後,中午開始就在我家裡的「辦公室」進行學術討論!他對我的研究一向就極感興趣,我們熱烈溝通討論到傍晚,彼此都要燒聲了!

他的學術專長就是目前最流行的所謂AI科技,MLDLCNN的基礎→機率統計!甚至他的兒子也已經是電腦科技專業玩AI的專家,但是他認為我的觀點是對的!有很多明確資訊可以使用的影像辨識,根本不應該揮劍自宮地使用這些統計學的工具,如果硬是橫柴入灶,也必然不會得到比我的方法更好的結果。

我們的討論是絕對沒有商業機密障礙的!他很好奇我的影像辨識如此厲害是怎麼作到的?有些他可以想像得到,有些不行!他會想親自跑來台南找我,就是想看那些他還不太能理解確定的部分。我也樂於讓他這位熟知AI科技的機率統計專家認證我的研發理念與實作方法,確實是優於現在熱門炒作的AI科技的!

我們談的議題很多,一時也說不完,就先舉出一個機器學習派一定不可能比我的辨識率更高的關鍵原因!就是機器學習或深度學習乃至CNN都有一個假設,就是影像辨識存在一個最佳解答,只要他們使用足夠大量的資料與統計技術就可以得到這個放諸四海皆準的SOP?但是真實世界很顯然不是這麼運作的!

如上的陰影車牌辨識案例,就是一個明顯例外的狀況,你用幾十萬張的,從正常到異常的所有資料統計歸納,取得最佳化的影像辨識SOP絕對不會適合它使用的!因為以統計學來說,它們身在幾十萬的資料中是在自然分布中偏離中值或平均值最大的極端資料,就像聾啞人你一定不能用語音跟他溝通,視障人士你不能假設他看得到一樣!但能看能聽才是統計學的「常態」,如果你的方案只能供「正常」資料使用呢?就必然會犧牲聽障視障者的成功機會了!

所以我的影像辨識概念基本上就不是找「單一最佳」的辨識流程的!而是讓最多可能辨識成功的案例能辨識成功!我的教育部不會只重視建中生,而是兼顧所有可能有成就的學生!我確實會跟機器學習一樣嘗試找到最「通用」的辨識SOP,可以用它直接辨識成功最多的案例,但同時間我也知道,真實世界就是會有如上的陰影例外狀況,我必須承認最標準廣用的SOP對它是無效的!已經生病的人必須有正常飲食睡眠之外的「異常」醫療措施才可能恢復健康。

如上圖中那些正負片與123的選項,其實就是我的多辨識流程策略的實驗介面!要辨識有陰影的車牌關鍵就是需要更嚴格(更低)的黑色目標亮度門檻!也就是我的1號策略,如果SOP沒有得到夠好的辨識結果,我就會依序嘗試不同策略的辨識流程,所以我的辨識是可以適應正常到異常的很多例外狀況的!這樣整體辨識成功率當然會高於堅持只有一個「最佳SOP的機器學習概念的辨識。

當然這是必須付出較長辨識時間代價的策略,我怎麼解決呢?其實就是提高辨識運算的速度,減少運算量,只要我的計算夠快我當然就會有時間多執行幾個辨識流程,這又是我們不可能採用CNN的原因了!CNN的所有運作都是必須以二維矩陣掃描全圖的!稱為卷積運算(Convolution)那是會整死人的耗時運算

只要用了CNN就不可能有多餘的運算空間作多重辨識流程了!但是我的OCR就可以!如上圖即使我已經使用了例外的流程,辨識時間(66毫秒)還是很快的!須知再神奇的AI技術也不會違背基本的科學概念與常識的!輪椅不能上樓梯這是常識,要讓輪椅上樓就必須有其他的無障礙設施,沒有例外但書與施行細則的法條必然是窒礙難行的法律!前提假設錯誤的技術也一定無法實現的!

不過說這些大概都算抬舉那些AI了!他們至今還無法正式提出辨識率夠高的商業化影像辨識軟體!所以只是空中樓閣!不要以為那已經是可用的影像辨識技術?他們還不是的!影像辨識領域中的這些「AI」產業,並不是靠AI製成產品產生的經濟效益賺錢的!因為根本還沒這種高效能的AI產品!他們只是靠課程、軟體模組與適合於那些AI演算法的硬體設備製造來賺錢的!大家「以為有用」是AI賺錢的來源,最終發現其實都沒用時,就會哭天搶地哀號受騙了!但是炒作虛偽AI功效的人已經獲利了結準備到其他領域去做AI詐騙了!

有誰推薦more

限會員,要發表迴響,請先登入