Contents ...
udn網路城邦
誰說我沒有用到機器學習?
2021/09/16 10:15
瀏覽688
迴響0
推薦4
引用0

機器學習乃至深度學習先天上的本質還是機率統計,一個以機率統計為主體設計的辨識流程,雖然可以應付複雜多變的狀況,達到「雖不中意不遠矣」的程度,但是要達到多數影像辨識應用需要的,95%甚至99%以上的高準確率,先天上就是不可能的!

但是如果限縮機器學習與深度學習的使用範圍,首先盡量使用傳統影像辨識的技術,盡可能的簡化擷取合理的目標資訊,當我們已經縮小範圍到一個程度,仍然無法確定唯一的答案時!就是機率統計,也就是機器學習應該出場救援的合理時機了!

如上案例,非常模糊的字元,即使絞盡腦汁經過千山萬水的努力,我也還是只能找到一些字元存在的「蛛絲馬跡」,即使將它們扭正、轉正、還併排放在一起,也只是如下的,很難確定內容的模糊影像資訊:

但是我怎麼這麼厲害?或這麼敢猜答案?居然直接說對它們是:YTSA270?其實這就是我從機器學習(ML)取經學會的技巧了!上圖左是商標,我的資料庫中有20多種,其中三字元的只有九種!所以我隨便亂猜就有11%的命中率了!就像機器學習會「標記」(Tag)答案,所謂的「學習」就是程式自我調整運算模型與參數,找出一個正確機率最大的「已知」答案!所以再怎麼不準確,都不會猜一個不可能的答案的。

9種三字元商標的第一個字取出來看,可能的字元只有BCHJSY等幾個字,我一一比對這幾個字模,看最像哪一個字?猜對第一個字的機率就從1/26升高到6/26了!英文字母有26個嘛!依此類推,三個字我都猜一猜,然後回頭比對最像9個商標中的哪一個?如果3字中對了兩字,可能答案就更少了,我猜對的機率又大增了!

機器學習中的貝氏定理運作方式大概就是這樣的!面對無法直接確定的事情就用機率與相關性來縮小範圍,最後正確答對的機率就會提高很多了!大家看看上圖右邊的字串,第二個字幾乎完全不能辨識,勉強拿幾個此位置可能的字模比對,結果最接近的答案並不是2,而是3

如上是我的主程式「多元」嘗試辨識的所有可能結果,包括把字串倒著看等等!最接近的答案也只是「A370」,但是資料庫中可能的選項只有"A270""A470",所以我當然不會選A370,拿24選一個的話,那個極不完整的「痕跡」只可能會是2,不可能是4,所以我就猜是A270,就答對了!

所以我這樣算不算是有用到機器學習了呢?當然算的!只是我把它當關鍵時刻的配角,它也很稱職的達成任務了!如果讓它當主角主導整個辨識流程呢?那會多亂多沒效率?我完全不敢想像,當然也不會嘗試的!

就像棒球比賽中的投手安排,一定是球技全面最穩定可靠,可以應付絕大部分狀況的球員才能擔綱先發投手,中繼或救援投手都一定有其強項專長,但只能適時視狀況推出上場。譬如碰到強力左打時就派左投手上場,當對手九局下累了揮棒速度變慢時,就派出火球男當終結者。

影像辨識是一個複雜精細的AI過程,真的應該像棒球隊的教練一樣,充分使用所有球員的所有攻防能力,讓整場比賽的每一個環節,都是讓最強最適合的人出場比賽!以上面這個辨識案例來說,少了機器學習的概念,幫我完成最後一哩路,我應該就會功虧一簣了!

有誰推薦more

限會員,要發表迴響,請先登入