即使我是用猜的,理由也是來自科學推理,而不是統計! - 鄉下老師 - udn部落格
鄉下老師
作家:鄉下老師
文章分類
    Top
    即使我是用猜的,理由也是來自科學推理,而不是統計!
    2025/12/15 03:11:07
    瀏覽:603
    迴響:0
    推薦:18
    引用0

    按照我做影像辨識的理念,凡事都要想清楚影像形成的前因後果,就是知其然也知其所以然,之後才據以設計最合理對症下藥的處理方式!所以我的日常研究是非常豐富有趣的!好像警察辦案,每個案子都有獨特之處,所以我寫文章的素材永遠不缺!如果我的影像辨識只是交給機器學習去跑模式呢?那就根本沒話跟大家聊,我也會無聊致死了!

    如上的這種案例確實讓我困擾扼腕歎息了很多年!以人的智慧當然可以看出正確答案是EMP-5193,但是從這個角度拍下去,車尾的防塵蓋就是會遮到51的上半部,在合理的字元區域截圖,那個1字怎麼看都像是一個T!即使我用車牌格式判斷它一定不是英文字而是數字,字形也會比較像是7而不是1!所以好多案例中的1都被誤判是7了!也不能要求開單員趴在地上避開防塵蓋拍車牌吧?

    所以我之前的辨識軟體版本答案一定是EMP-5793!真的很吐血!就差那麼一點點,我知道它是1,但我的軟體卻只能判斷它是7!那個我聰明的大腦中可以判定它是1而不是7的理由,就是「智慧」了!如果我找到那個邏輯,把它寫成程式,那就是「人工智慧」(AI)了嘛!為此真的想了好多年!

    上圖左就是我從原圖中挖出來的字元影像,右邊是71的標準字模,正常比對符合度,或是看上寬下窄的形狀特徵都是比較像7而不是1!但是我發現了一個特徵讓它露餡,它絕對不是7!就是7的中軸線是歪的,所以任何一個X位置的上下貫穿直線都不可能是全黑的!依此特徵就可以排除它是7的可能性,那它就一定是1了!就這樣破了一宗揪心多年的懸案了!

    所以我辨識的依據還是明確的科學原理,或者說是明確的人為(字形)規範!絕對不是甚麼機器學習或深度學習的統計結果?譬如車牌的那個位置(第五個字)1的機率高?還是是7的機率高?這種統計(學習)的結果有意義嗎?可以提高你的車牌辨識正確率嗎?當然不行!這就是真科學與偽科學之間的差異了

    假如某統計資料說愛吃紅蘿蔔的人血壓比吃白蘿蔔的人血壓高?這沒有多大意義!重點是必須研究出為何有此關係的科學原因!然後針對這個明確的原因做出更精準的對策才是真正科學的作法!譬如是因為紅蘿蔔中的某個成份比白蘿蔔多,導致了血壓升高的效應,掌握這個差異控制該成分的攝取量,當然比吃不吃甚麼蘿蔔有意義!

    所以我說機器學習乃至深度學習都不是真正嚴謹的科學!不是沒有用處,但是用在需要高度辨識率與準確性的影像辨識上就非常不適合!簡單說,就是依據不知其所以然的統計資訊做出的判斷不可能太準確!如上比喻就是即使你不吃紅蘿蔔,猛吃白羅蔔也不保證血壓會變低的!

    看出其中的差異了嗎?當我手邊的資訊不足或互相衝突時,我也會做猜測的!但即使是用猜的,我們還是應該盡力分析所有因素,做出最合理的判斷,而不是靠不相干的過往經驗統計結果來猜!所以我的車牌辨識絕對會比機器學習或深度學習做的產品更準確更合理!任何影像辨識也都是如此的!所以是ML、DL與CNN比較AI?還是不用這些統計學技術的我比較AI呢?

    回應

    限會員,要發表迴響,請先登入