
前兩天委託我開發這個辨識核心的廠商非常緊張的跟我說我的軟體「錯誤很多」,他可能要面臨違約官司了?我聽得滿頭霧水?好像我犯了天大的錯誤?但是他之前其實只給了我55張影像來製作這個辨識核心,我當然就以那些資料做研究,也理所當然地做到55張都是百分百正確的!何來錯誤很多的評價?
溝通之後才知道,他們拿我的初版軟體用終端客戶新提供的1200張影像測試,結果有約60張出現錯誤!即使這麼計算,辨識率1140/1200也達到95%了!以僅僅根據55張影像製作的辨識核心原型來說,第一版就有這麼高的辨識率算是很好了!
就像面對幾十個人的班級,我努力教學把每個學生都教到100分了,但不表示我的教學方法直接套用到1000人的學校也可以讓每個人都拿到100分的!因為很多我沒教過的學生會出現甚麼意外?我根本無從想像!但是如果讓我看到實況,知道他(們)為什麼學不會,我總是可以見招拆招順利解決問題的!
所以我根本無法跟著他們起鬨緊張!只是冷靜地請他們把出錯的資料,甚至他們拿到的所有資料傳給我研究!他們又不會自己解決問題?不把問題交給可以解決困難的我?在那邊窮緊張甚麼?有人生病就請病人去看醫生嘛!一家人圍著病人乾著急窮緊張沒用的!
果然資料傳來後當天就馬上分析解決了錯誤的那幾十張影像,辨識率就是百分之百了!大部分出錯的狀況大概就像上面的案例!我應該從左邊的圖上找出25個圓形的目標,但是背景那麼複雜,就是有可能剛好意外形成類似圓形目標的雜訊!只要讓我看到出錯的實際狀況,我分析它的屬性位置等等,找到它和正常目標的差異,調整一下安檢機制就可以輕易把它排除,答案就會都對了!
因為我總是經過系統整合商間接取得資料做研究的!這種問題也不是第一次發生了!乾脆說出來跟大家分享!我作影像辨識的方式跟那些機器學習派是不一樣的!我一開始並不需要幾千幾萬張的資料來訓練模型!只需要數十張影像就可以建立出基本架構的原型,也當然會做到數十張影像都能完全正確辨識!
但是這個原型還是必須經過夠多的資料測試洗禮,才會看出初始設計時沒考慮到的一些細節意外狀況!每一個錯誤我都可以分析原因,也都可以微調參數或建立新的例外處理!通常沒測試到幾千張都不算完成的產品!所以我的合作廠商是掀鍋蓋太早了!菜根本還沒煮好嘛!這是正常狀況,不必自己嚇自己的!
當然如果他們一開始就給我這1200張影像做研究,這些驚悚的過程就完全不會發生了!可是我寧願他們先給我數十張影像做個開始,我就可以依據這些少量資料提出建議,調整拍攝的方式,以提高辨識率降低辨識難度後再大量拍攝!就是滾動式調整的意思,大家比較不會浪費資源!
限會員,要發表迴響,請先登入




