機率統計的概念我也會用的！ - 鄉下老師

Contents ...

機率統計的概念我也會用的！

2021/11/12 15:59

迴響0

推薦6

引用0

這也是一個相當困難的辨識案例，主要是因為右半邊的陰影顏色深到跟字元幾乎一樣！所以如上經過好多步驟的篩選之後，還是有兩塊其實不是字元的目標混進了決選名單之中。聰明的人腦當然一下子就可以摘掉雜訊，辨識出答案應該是JDF，但是我要怎麼告訴笨笨的電腦誰是雜訊呢？

這是我稍早跟客戶報告時說要思考設計的方向，當一堆合理目標與雜訊混處時，我要建立一些邏輯，像人腦一樣鎖定比較可能是字元的群組，建立一個合理字元大概的寬高或位置等等屬性，再回頭用這個估計值來篩選目標。譬如上面的兩個雜訊，b目標位置太內側(接近圓心)了，a目標則是徑向的長度大於JDF幾個目標很多，都是他們「該死」的理由！

重點是我如何用數學邏輯知道JDF這幾個目標比較可能是正確的目標？其實就是使用機率統計的概念！也正是所謂機器學習派信奉的大神！如果我想知道最可能的字元高度，就可以統計這些目標，找到最多目標集中的那個高度，但是前提必須是這些目標群中合格的目標已經略多於雜訊假目標，如果你用上圖中的狀況去做機率統計，最多目標集中的大小一定是小雜訊的碎片尺度，而不是真正的字元大小！

我不會誇張的說我是使用機器學習的演算法！只是部分程序使用的概念有點相似而已！機器學習派是真的會在上圖中的階段就將目標群丟給電腦「學習」的！可以想像那會有多亂？多慢？還多不可靠？我則是會像剝洋蔥一樣，一層一層淘汰最不可能的目標，包括那三條輻射線，直到剩下沒有直接明確條件可以用時，才會進入機率統計的估計猜測階段，當然正確猜對的機率就會很高了！

我之前就一再提到，我對機器學習的方法概念不是全盤否定的！而是反對以這種概念方法作為影像辨識的主體！他們是沒招可用時的最後選項，不是前提，更不是主體！如果不是碰到如此複雜困難的辨識，我應該不必撐到這個階段就已經用精準的傳統影像辨識方法得到答案了！不會用到機率統計的！

他們所謂的AI技術就是從大量資料中，利用機率統計的數學演算法，自行找出規律，找出最可能的答案！但是真實世界的資料中，有很大一部份是經過前人研究，已知遵守很多原則與定理的！所以合理的AI研究方向絕對不是早早就將資料倒入機器學習或深度學習的攪拌機，那只會浪費時間得到一大堆垃圾！

正確的方式應該是先使用已知可靠的科學原理與客觀條件，歸納、篩選與整理資料，到了實在無法更有序化的階段，才是機器學習應該出場的時刻。以影像辨識來說，ML與DL其實很像NBA的板凳球員，甚至是正常輪替陣容之外的球員，如果不是打到勝負已分的垃圾時間，他們根本沒機會上場的！或者說像考試，知道答案的題目當然要很肯定的做答，只有真的不確定會的題目才應該用機率蓊計概念猜測最可能的正確答案。

所以我做這麼多影像辨識專案，如上必須使用到「類似」機器學習概念演算的機會非常少！但也說明了，我不是對機器學習有偏見或成見，所以就是不爽用！而是真的很少有必要而已，大家「以為」機器學習很重要，其實都是被有心人士故意愚弄哄騙了！