
前幾天北上與委託我們做紙箱體積辨識的客戶開會,經過我們的簡報,我們開始討論後續研發方向重點時,得到了一個有趣,但也很有意義的結論就是:「必須先把應可辨識的較清晰影像做到沒有意外的錯誤!」簡單說就是:必須先專注在比較好辨識的案例,讓它們不會產生任何奇怪的,無法跟客戶解釋的錯誤!
任何議題的影像辨識都會有一些困難案例會挑戰到我們辨識技術的極限!以上圖為例,上面的車牌是使用者認為清晰到應該可以正確辨識的案例,我們的SOP應該也都能辨識!但是任何演算法的流程複雜到一個程度時,難免會有些意外衝突,某些我們沒想到的小雜訊就可能會讓流程意外迷航出現錯誤答案!
上圖下方的車牌相當模糊,我們的演算法不能說毫無機會,但是辨識正確的機率一定不高!想要硬解這個難題需要的功夫一定不小,辨識流程因此複雜化之後可能意外出現錯誤的地點就更多了!就是為了讓這些極端案例能夠辨識,「想太多」反而讓一些正常的案例失控出錯!也就是機器學習常說的Overfitting了!
所以紙箱辨識專案前面幾個月一直在挑戰之前客戶自行開發版本會失敗的困難案例,我們也無法全對,大概就是做對六七成左右,但那些可以說是魔王題!如果扣除一般人都覺得不可能成功的複雜案例,加入大量正常一點的案例,辨識率就會是漂亮的九成多了!
在場的公司業務也說:客戶不會因為我們無法辨識魔王題有太多意見,但是看似正常的案例卻辨識錯誤就很難不被批評嫌棄了!面對使用者的第一線業務人員當然最怕這種狀況了!技術人員還比較知道如何解釋錯誤原因,業務呢?就只能尷尬傻笑了!
做老闆的都知道:任何產品都不能毫無止盡的研發下去卻遲遲不推出產品的!醜媳婦終究是要見公婆的!如果覺得已經可以符合客戶的認可標準,就應該先推出新版本的!研發當然可以繼續做,但是生意也必須繼續做,不然哪來的錢繼續研發?所以當天的結論是要提供更大量的一般難度影像,做穩定性的測試調整,就是要盡快推出產品的意思!
這就是業界與學界的最大差別了!業界的錢一定是來自真的可以替客戶產生實質的經濟效益!學界的錢則是來自民脂民膏國民納稅的錢!還被少數學閥霸佔濫用?所以即使是「做研究」這件事,科技業界在錢的現實壓力之下,實質效率也絕對是遠遠高於學界的!
我們這種公司做的「生意」其實就是來自科技研發的成果!我們這個小公司一年的專案成果鐵定會高出任何類似性質的大學研究室好幾倍!因為沒那麼高的效率就賺不到足夠繼續經營存活的錢了!想想以前為了爭取國科會計畫弄得那麼沮喪真的很可笑!我拿不到計畫根本與我的能力高低無關!只是學閥們坐地分贓時不願分我一杯羹而已!有甚麼好難過的?
事實上那些學界研究團隊根本經不起真實世界的考驗!試問全台號稱在研究車牌辨識的數十個大學研究單位,哪一個曾經達到商業化的標準?哪一個曾經真的完成產學合作推出可以實際使用的技術或軟體?真的太虛偽了!
他們還說「產學」計畫的位階應該低於「純學術」的計畫?以此掩飾他們做的研究其實根本毫無用處?真的是恬不知恥!好高興我現在是活在一個真實有意義的世界,用改變世界的實際作為賺錢討生活!我覺得我是比頂大教授活得更有尊嚴的科學家!沒有國家的奶水,那些教授有幾個人活得下去?
限會員,要發表迴響,請先登入





