學影像辨識，視覺化的過程很重要！ - 鄉下老師

Contents ...

學影像辨識，視覺化的過程很重要！

2020/08/28 07:58

迴響0

推薦6

引用0

我正在寫影像辨識的書，寫到這裡必須作一種字元變形的修正，忍不住寫了一個實驗介面，讓讀者可以自己作視覺化的實驗，看看在原始影像頂部往右拉，底部不動的情況下，拉扯量不同時產生的變形修正結果。這個運算如果直接寫出程式，找到最佳拉伸量轉正影像只需要一頁的篇幅，這樣寫法就會多出好多程式碼，這些程式到最後也會被移除或註解掉，真的只是為了幫讀者思考理解用的。

我的書多半都是這樣寫的！因為我自己讀專業用書的痛苦經驗，就是作者認為不必講的過程常常就是我最難懂的痛點！尤其是影像處理，如果你給我一個精巧神奇的數學公式，幾十行程式，最後是運算結果圖，加上好多理論解說。那還不如將你認為「不重要」的處理過程圖像多貼幾張，看到視覺化的過程，任何人都可以輕鬆看懂了！

我覺得寫教材與寫論文的差異就在這裡！論文的重點是內容正確，證明你很厲害，還可以給專家驗證！寫教材的重點則是要盡量讓任何人都看得懂！至於作者是不是很厲害？用的技巧是不是最棒的？根本不重要。譬如上面的這種修正，其實我腦袋裡有七八種用過也證實可行的辦法，但是我要寫書時，並不是找出最高效率(最神奇)的那種方法，而是最容易讓讀者看懂學會的方法。

如果我堅持講最高效率，理論上「最好」的演算法，就會掉入多數專家寫教學用書的陷阱！你以為你盡力了，但是最好的方法通常也是最抽象的方法，對於初學者外行人士就是最難理解的方法！看完書之後只能讚嘆作者很神，讀者還是沒學會如何處理那些問題，而且還間接摧毀自信，不再敢大膽使用自己的常識與直覺認為可行的方法！誤以為一定要用書上寫的那些神奇演算法才能解決問題？

現在不是很多人以為，要作影像辨識一定要學CNN，OpenCV或深度學習嗎？在我的角度是完全胡說八道！這些東西我一樣都沒學過時，就可以比學過的人作出更多商業化影像辨識產品了！我最近才剛開始學那些大家說「一定要會」的東西！有沒有加分的效果？都還有待觀察！據我目前的學習進度所知，這些方法的根基也無法脫離基礎影像辨識邏輯的！不要書讀太多反而變成失根的蘭花了！

我想寫影像辨識書的動機之一，就是我從自身經驗充分體會也證實：影像辨識是一個物理問題！跟著你的物理概念，就是一些基本常識，以及數位影像的基本結構知識，你想怎麼作就試著寫程式去實現，不論姿勢好看與否？你總是可以將問題解決的！先有了堪用的方法，再來研究提升效率，努力個幾年你就有機會跟我一樣這麼商業化了！

所以我的書不會陳義過高，要將自己的影像辨識本事精銳盡出，甚至鉅細靡遺？而是希望順著讀者已經很習慣的常識直覺，引領讀者用最容易理解掌握的方式，寫出一些真的可以解決問題的程式！看得懂書的內容，敢使用學到的技術，還敢於嘗試自己的新想法，這才是我想達到的目的！

簡單說，我想寫的是有啟發性的書，不是字典，不是工具書，更不是甚麼個人的里程碑？經典著作等等。而是可以幫助你建立自信，建立一段從你的常識直覺到完成影像辨識工作門檻之間的階梯！