合理的猜測也是AI！ML使用機率統計，我的OCR也可以！ - 鄉下老師

Top

所有文章 / 目前分類：心情隨筆|工作職場

合理的猜測也是AI！ML使用機率統計，我的OCR也可以！

2025/12/23 01:34:18

迴響：0

推薦：13

引用0

這樣扭曲的車牌也能辨識正確？會不會太誇張了？一定有作弊吧？確實如此！左右兩邊的字扭曲得如此厲害，應該是無法經過正常的字模比對門檻加以確認的！把變形的E與6去比對標準字模，或許在眾多字元中E與6還是分數相對較高的？但絕對不像正常的字元那麼高！我的標準辨識程序(SOP)不會直接認定它們是E與6的！

所以拘謹的合理答案就是MG-567囉？在台灣的車牌格式中確實是有這種可能的！就是工程車了！但它們都是綠底白字或白底綠字的，而且字型一定是屬於六碼車牌的圓胖格式。可是那個清晰的6字已經露餡證實這個車牌是屬於七碼車牌了！看下面的兩種字型的6就很清楚了！左邊是六碼車牌，右邊是七碼車牌！

所以如果我不做進一步的處理，從已知的線索就知道MG-567是一個鐵定錯誤的答案！不可能有這種車牌的！那我還要報給客戶知道嗎？當然不行！通常就是直接「不起訴」處分了！軟體的回應就是：找不到(合理的)車牌，宣告此案例無法辨識了！如果那個6字是符合六碼車牌字型的6呢？那當然就回報MG-567了！至少有機會答對！你沒有其他可以否決它的證據嘛！

但是就此放棄說無法辨識畢竟心有不甘！就像警察面對有著一些不完美證據的懸案一樣，有沒有可能在之前遺漏被淘汰的資訊中，找到合理的跡象，再根據機率統計的概念「猜測」出一個最合理，可能性最高的正確車牌呢？其實這就是現在流行的機器學習與深度學習的基本概念了！他們的合理性評估標準更低！只是依據目視正確的資料答對率來猜而已！不像我會考慮所有物理原理與法規的限制來通盤考慮！

以此例來說，我已經知道它應該是一個七碼的車牌了！但是可以辨識的只有中間的5個字，從七碼車牌的規則推論，前面應該少了一個英文字，後面則是少了一個數字！所以我在預期有缺字的部分做字模比對，即使符合度未達預設標準，也考慮其中「最像的字元」是否合乎車牌格式？如果合格就盡量降低審核門檻讓它過關吧！好像降低及格分數給補考機會的概念！

我得到的兩個敗部冠軍字元就分別是前面的E與後面的6了！以台灣的七碼車牌來說，E是很常見的電動車車號，所以我就依據經驗法則，讓它加分過關了！6字也是以降低錄取分數的方式，讓它可以以低標錄取了！這樣就在合乎法規格式與經驗法則的機率統計前提下，我猜測了一個非常合理，正確機率很高的答案EMG-5676！也完全符合所有人會做的目視判斷！

當然如果更扭曲一些，目標字元連低標符合度都不夠，就是根本無法判定是甚麼字？我也只能放棄了！並不是每個這種扭曲車牌我的軟體都一定會有答案的！如果根本看不清楚亂猜，答對機率太低時，反而不如承認失敗，以免無謂增加後續管理者的困擾，就是認錯車或找不到那台車啦！

大家認為的ML、DL與CNN的優點之一，就是它們是以機率統計為基礎，只要有一點蛛絲馬跡就會有反應！不像OCR製作的專家系統那麼一翻兩瞪眼？辨識失敗就甚麼結果都沒有！其實不是那麼涇渭分明的！我的OCR就可以進化到善用所有殘餘資訊，考慮經驗法則與機率統計的概念，幫我做出更聰明，也就是更AI的辨識決定！推理過程的精緻微妙真的有如CSI辦案！

所以我的影像辨識是比ML、DL與CNN更先進的專家系統！我的OCR絕對不是過時的技術！而是優化更新之後的最先進技術！我也願意面對挑戰，以學術研究的務實精神自我剖析，也願意跟ML等技術公開交流競爭！問題是他們敢不敢跟我PK而已！因為以既有資訊來看，怎麼看都會是我贏的！

回應

全站分類：心情隨筆｜工作職場

自訂分類：不分類

上一則：別傻了！歪斜車牌的辨識絕對不可能靠深度學習做到的！
下一則： FB加朋友？至少要讓我知道你「可能」是誰吧？

你可能會有興趣的文章：

AI說我是歪斜變形車牌辨識關鍵技術之一？應該是唯一吧？
想辨識出自然情境的車牌，絕對是精密複雜但合理的過程！
車牌辨識系統怎麼都這麼貴？我的超低價把客戶嚇呆了！
一個都不能少？影像辨識也用到我的教育理念了！
影像辨識直接做就好了！不必用甚麼學習的！
Google的AI認為我是這樣的一個人！

限會員,要發表迴響,請先登入

	作家：鄉下老師