我追求的不是極端辨識能力,只是正常手機拍照的情境! - 鄉下老師 - udn部落格
鄉下老師
作家:鄉下老師
文章分類
    Top
    我追求的不是極端辨識能力,只是正常手機拍照的情境!
    2026/01/04 14:50:36
    瀏覽:330
    迴響:0
    推薦:6
    引用0

    我現在沒有特定影像辨識專案研發時的日常工作,就是拿出這些以往會無法辨識的車牌照片,即使已經可以正確辨識了!我也會逐一檢視每個辨識流程的每一個細節,找出阻礙辨識或拖延速度的每一個細節,看看有沒有改善優化的可能?也就是希望我可以用更多個不同的流程都能得到正確答案,而且速度越快越好!

    之前有些人看到我那麼費力研究這麼歪斜變形的車牌,會開玩笑地說我很「變態」?還是吃飽太閒?想辨識車牌的人當然會盡量拍得正一點,不會有很多這種極端狀況的!要辨識那麼畸形狀況的車牌,我必須花上比辨識正常車牌多出十倍不止的努力!但是這種極端狀況應該很少見吧?

    事實不然!以這張影像為例,如果你跑到兩輛路邊停車的縫隙,拿起手機想拍車牌,又不願費事蹲下身去喬個較佳角度再拍,站著往下拍就會是這個樣子的!所以這不是甚麼極端狀況,就是路邊開單員日常工作的常態!如果我的軟體,也就是他們公司使用的車牌辨識軟體無法辨識這樣的車牌呢?他們就麻煩大了!

    我們做AI軟體不就是想幫助人?讓各行各業可以更輕鬆有效率的完成各種工作?所以我才會如此努力的焚膏繼晷日以繼夜的研究這些歪斜車牌的辨識技術!現在大家都會說:不必這麼辛苦吧?收集夠多的資料讓電腦深度學習(DL)一下就可以了吧?但事實上就是很難辦到!可以說大家都被騙了!

    首先是需要的資料量與運算量都大到超乎想像,錢不夠燒的小公司根本玩不起的!因為可能的歪斜角度太多了!機器即使可以學會辨識某些歪斜車牌,但他們是基於統計機率的猜測基礎,所以不能保證每張都能精準處理,很多細微的雜訊變因都可以讓辨識失敗錯誤,所以實質辨識率是不可能太高的!而且使用CNN(YOLO)等技術做處理的辨識軟體運算量都太大了!一定需要GPU等額外硬體幫忙才能趕上一般人預期的反應速度,也就是系統需要的硬體會很貴啦!

    所以我的研究價值不只是替第一線的使用者減壓,讓他們可以更輕鬆地拍照就能符合後端軟體的辨識能力!另一方面,我很刻意地避免使用必須以高運算量為代價的MLDLCNN等所謂的AI技術!結果就是我的軟體不但比以統計學為基礎的AI準確穩定,計算量還更少!辨識速度更快!還不需要使用GPU等額外硬體支援!連老闆都會省錢很多AI的目的不就是這樣?降低成本同時增加效益嗎?

    所以我認為我是為大眾服務的優良AI業者!我的研發重點方向都是經過審慎評估考慮的!截至目前也都能達到預期的效果!反而是我一再看到MLDLCNN的使用團隊,投入大量資本卻成效不彰!勉強上市的產品都太貴還辨識率欠佳!辨識錯誤時也得不到解釋與優化升級服務!各位客戶要小心了!想買影像辨識產品千萬不能聽到是AI?就付錢了!務必貨比多家,確定符合你的需要之後才能真的花錢買下去!AI產業中騙子比誠實廠商多很多的!

    回應

    限會員,要發表迴響,請先登入