Contents ...
udn網路城邦
窮則變,變則通!因為電腦爛,就逼出了好AI!
2025/11/05 08:38
瀏覽400
迴響0
推薦13
引用0

 

2022年台元科技園區委託我做了一個車牌辨識的軟體專案,內容包括寫一個平板電腦可以使用的動態車牌辨識軟體,方便他們的保全人員手持平板巡視停車場檢核停車權限是否相符?還包括一個資料後處理軟體,可以辨識每日收集到的手拍照片的車牌,統一縮圖到一個較小的圖檔加上文字標籤寫在圖上存檔。

與我接洽的聯絡人很客氣,或許是太客氣了!我的軟體有些小缺點她都覺得不想太麻煩我,自己設法處理,反而是我發現後會主動修改幫她更新!我改程式只是一次性的工作,程式操作不便他們可是天天都要被困擾的!所以我都會請客戶千萬不要客氣,售後服務是我很希望做好的事!也是我開軟體公司的初衷!希望大家都能輕鬆享用高科技軟體,呼叫原廠跟叫巷口的水電行一樣方便!

今年他們在運作幾年後開始有些新想法,就主動付費要我修改新增一些功能,辨識核心當然也順便更新了!此時才知道他們的平板可能效能不如預期,我的動態辨識程式在一般電腦是可以輕易跑到10Hz以上的,但是在他們的平板上只能跑3-5Hz,感覺鈍鈍的,所以有些保全就不愛用,直接用自家手機拍了!

主管還是很客氣的說她知道這是電腦效能的問題,請我調整看看?無法更快她也可以諒解!我就請她將那個「效能不太好」的平板寄給我做實機的測試。就是在那次測試時,我想到了可以簡化我的動態二值化程序,全圖只用一個單一二值化門檻值,減少很多運算後就讓原本3-5Hz的低速狀況提升到超過10Hz了!

如上圖左就是全圖使用單一門檻產生的二值化圖,圖右則是我原本較精準有彈性的動態門檻二值化產生的圖!很顯然的左圖的細節少多了,後續的所有運算處理當然也隨之簡化,但只要主目標車牌沒有被簡化掉,就還是可以正確辨識出車牌的!反之,要從右圖中找出車牌,因為畫面一定會很複雜,無用的冗餘計算就會多很多了!

但我也知道將二值化的過程簡化一定會降低辨識率,簡單說,就是全圖如果只用單一的二值化門檻,對於畫面簡單、環境亮度充足、焦距也精準的清晰影像是沒問題,但是對於畫面複雜、較陰暗、略為曝光或失焦,甚至有陰影使得車牌半黑半白的較差影像就辨識率很差了!

所以在那之後,我就一直在研究如何在只用全影像單一二值化門檻的前提下,還是可以正確切割出車牌?讓辨識率盡量提高到與我原來的SOP辨識率相近!經過幾個月的努力我真的做到了!如果我的舊有SOP可以辨識到98%的資料集,只用單一門檻的快速模式,辨識率也可以超過95%了!

所以我目前已經將單一門檻的快速模式當作類似「快篩」的用途!就是把單一門檻的快速模式當作預設的第一個辨識程序,如果沒有好的結果,還是會驅動舊有的動態二值化模式進行「強力」辨識!這樣就可以讓我的整體辨識速率幾乎倍增!遇到困難的辨識案例也可以完全保有舊版的辨識能力與高辨識率!昨天我也把這個最新版免費更新給台元科技了!

所以這個故事的起點是從一台效能不夠好的「」電腦開始的!現在大家都知道:所謂的「AI」就是用很多演算法與大量計算產生的人工智慧!所以電腦的計算能力當然會影響AI的效能!當CPU的計算能力都不夠用時,就把顯示卡中的娃娃兵GPU也推上前線了!輝達就是這樣發達起來的!

但是現實上呢?台元科技園區當然可以隨俗蹭AI,買更好的電腦,甚至導入使用很多GPUAI軟體,但那些方案是要花很多錢的!即使他們有錢,也會考慮花這些錢有沒有必要?CP值是否夠高?我提供的選項與服務就是:在不降低AI辨識品質的前提下,減省運算量,讓軟體更聰明!就不必花錢買新硬體了!

我這麼努力減少運算量的作法,輝達可能不太高興?台積電也可能不高興?但是我的客戶會很高興!因為可以用更低的成本享用更高效益的AI!我也很高興!除了可以鼓勵更多人購買我的(便宜)產品,我也不必為了我的AI軟體運算量持續暴增,而必須採購昂貴的新(GPU)電腦來維繫我的研發工作!而且整個地球都會很高興!因為可以節能減碳減緩地球暖化的衝擊嘛

當然我可以往這方向努力的先決條件是:我是不使用機器學習(ML)、深度學習(DL)與類神經網路(CNN)的!在那些演算法中,以我的能力是無法找到能大量減少運算,又能提升或保持AI品質的策略的!DeepSeek好像在減少運算方面有些成果?就嚇壞很多AI廠商了!如果大家都節省運算都不需要GPU了,股票市場會崩盤的!但是在我使用的OCR技術中,我就是可以做到很精簡的運算!我的軟體至今都還完全不必用GPU的!謹供大家參考!

有誰推薦more

限會員,要發表迴響,請先登入