Multi-Classes 與 Multi-Labels - 飛虎行空

Contents ...

udn網路城邦

精選

Multi-Classes 與 Multi-Labels

2019/06/14 08:43

迴響0

推薦4

引用0

分類問題是機器學習的基本大法，當然二分法是最基本，因為多分類其實可以使用二分法來解．如果多分類再細分，可以分為 Multi-Classes 和 Multi-Labels 兩種．所為 Multi-Classes 是ㄧ對一的關係，例如手寫數字辨認，每個案例只會分到 0 - 9 分類中的ㄧ個類別．而 Multi-Labels 是ㄧ對多的關係，例如ㄧ則新聞可以分類為政治和法律等多個類別，也有可能ㄧ張相片存在貓和狗．

所以 Multi-Classes 與 Multi-Labels 在機器學習的手法上會不大相同，對於 Multi-Classes 大家比較熟悉，在類神經網路的輸出端加入 softmax 就可以達到多分類器的效果，選擇最大機率項目既可．而 Multi-Labels 的手法就比較複雜，主要有兩種解法，ㄧ種是將 Multi-Label 資料集轉換為 Multi-Class 資料集，這樣就能適用原有演算法，而另外ㄧ種就要擴充原有演算法來解決 Multi-Label 問題．

基於問題轉化的方法中有的考慮標籤之間的關聯性，有的不考慮標籤的關聯性。最簡單的不考慮關聯性的演算法將多標籤中的每一個標籤當成是單標籤，對每一個標籤實施常見的分類演算法。考慮多標籤的相關性時候可以將上一個輸出的標籤當成是下一個標籤分類器的輸入。

改編演算法來直接執行多標籤分類，而不是將問題轉化為不同的問題子集。在傳統機器學習模型中穿件的多標籤分類模型有: kNN 多標籤版本 MLkNN，SVM 的多標籤版本 Rank-SVM等。在深度學習中常常是修改多分類模型的輸出層，使其適用於多標籤的分類。

回覆引用