我們能辨識日本車牌了！ - 鄉下老師

Contents ...

我們能辨識日本車牌了！

2020/03/10 05:58

迴響0

推薦11

引用0

去年六月某廠商給了我們一批日本車牌的照片，原本計畫委託我們研發辨識核心，但是因為我們也不知道的原因，他們又臨時喊卡了。事實上我之前就評估過日本車牌的辨識可行性，不像多數國家地區只需要辨識單排的英數字，他們的車牌不僅是雙排字，日文與漢字也都需要辨識，內部字型還不一樣大，應該算是超級困難的案例。想像一下，車牌上可能出現的地名就有這麼多！

{"札幌", "函館", "旭川", "室蘭", "釧路", "帯広", "北見", "青森", "八戸", "盛岡", "岩手", "平泉", "宮城", "仙台", "秋田", "山形", "庄内", "福島", "郡山", "会津", "いわき", "水戸", "土浦", "つくば", "宇都宮", "那須", "とちぎ", "群馬", "前橋", "高崎", "大宮", "川口", "所沢", "川越", "熊谷", "春日部", "越谷", "千葉", "成田", "習志野", "袖ヶ浦", "野田", "柏", "品川", "世田谷", "練馬", "杉並", "足立", "八王子", "多摩", "横浜", "川崎", "湘南", "相模", "山梨", "富士山", "新潟", "長岡", "長野", "松本", "諏訪", "富山", "石川", "金沢", "福井", "岐阜", "飛騨", "静岡", "浜松", "沼津", "伊豆", "富士山", "名古屋", "豊橋", "三河", "岡崎", "豊田", "尾張小牧", "一宮", "春日井", "三重", "鈴鹿", "滋賀", "京都", "大阪", "なにわ", "和泉", "堺", "奈良", "和歌山", "神戸", "姫路", "鳥取", "島根", "岡山", "倉敷", "広島", "福山", "山口", "下関", "徳島", "香川", "愛媛", "高知", "福岡", "北九州", "久留米", "筑豊", "佐賀", "長崎", "佐世保", "熊本", "大分", "宮崎", "鹿児島", "奄美", "沖縄"}

所有需要辨識的中日文字元有這麼多：{"い", "き", "ぎ", "く", "ち", "つ", "と", "な", "に", "ば", "わ", "ヶ", "一", "三", "下", "世", "並", "久", "九", "井", "京", "仙", "伊", "会", "佐", "保", "倉", "児", "八", "内", "函", "分", "前", "北", "千", "南", "取", "口", "古", "台", "名", "和", "品", "土", "城", "堺", "士", "多", "大", "奄", "奈", "姫", "媛", "子", "宇", "室", "宮", "富", "小", "尾", "屋", "山", "岐", "岡", "岩", "島", "崎", "川", "州", "帯", "幌", "平", "広", "庄", "張", "形", "徳", "志", "愛", "成", "戸", "所", "手", "摩", "敷", "新", "日", "旭", "春", "本", "札", "杉", "東", "松", "柏", "根", "梨", "森", "模", "横", "橋", "歌", "水", "沖", "沢", "河", "沼", "泉", "津", "浜", "浦", "湘", "滋", "潟", "熊", "牧", "王", "田", "留", "盛", "相", "知", "石", "神", "福", "秋", "立", "筑", "米", "練", "縄", "美", "群", "習", "良", "葉", "蘭", "袖", "見", "訪", "諏", "谷", "豆", "豊", "賀", "越", "足", "路", "那", "郡", "部", "都", "重", "野", "金", "釧", "鈴", "長", "関", "阜", "阪", "青", "静", "須", "飛", "館", "香", "馬", "騨", "高", "鳥", "鹿"}

光是建立可以辨識那麼多字的參數資料庫就是很繁重的工作了，一般的英數字加起來才35個字元。尤其是日文與漢字的筆劃較英數字多而複雜，使用一般OCR(字元辨識)常用的字模比對法去辨識穩定性很差，我在幾年前嘗試辨識大陸車牌時就吃足苦頭，一個10X20畫素的矩陣就足以清晰辨識英數字了！但是用來辨識一個「贛」或「藏」字呢？即使影像清晰，但只要錯位一個畫素，筆劃就全部對不準，你就很難確定是哪一個字了！

因此前面幾年有不少人問過我能不能作日本車牌的辨識？我的答案都是：Forget it！實在太困難了！除非我們可以發明出不同於一般字模比對的字元辨識方法，可以更準確的辨識掌握日文與中文(漢字)的筆劃，不然怎麼努力辨識率都不會很高的！一般停車場用的車牌辨識，如果不到98%就不及格了！

當這次客戶決定放棄不做之後，既然有些資料可以研究，我就決定交由我的RD操刀當作公司的自主研發，先與RD充分溝通之前辨識大陸車牌的經驗，也設定要研究出一個對於辨識中日文比字模比對更有效與準確的辨識方法，不然就算了！反正沒人付錢嘛！我們就沒有必須何時完成的期限壓力了！如果此案正式簽約的話，我是答應半年內要完成的！

這個研發議題在我們諸多專案研發的空隙中，經過斷斷續續近九個月的研發，終於完成了！所有日本的漢字地名與日文(假名字母)字碼都能正確快速的辨識了！當然要準確定位車牌的雙排字位置也比台灣車牌困難，但是我的RD通通順利過關！尤其是以向量偵測概念建立的中日文字辨識方法，不僅辨識率高，甚至比字模辨識更快，真的應該給她頒個博士學位了！

她設計的辨識法不是我的智慧財產，細節我就不便多說了！讓大家欣賞一些辨識案例吧？請注意到這些都是1920X1080兩百萬畫素的高解析全景照片，很多還有陰影，但辨識時間多半是一百多毫秒，這種速度其實比我的台灣版本還要快！我這幾天努力「研究」RD寫的程式，真的完全找不到可以挑剔批評之處！我好像可以考慮退休了？