하나의 Sample에 여러 label이 존재할 수 있는 것이며 이미지에서는 보편적인 task이다.
이미지에 고양이, 강아지, 사람이 있을 때 모두 찾아내는 task
단 하나의 class만 구별해야 하는 task보다 모델 구조도 복잡하고 더 어렵기도 하다.
Compared with single label classification, multi-label classification requires special attention on two problems:
how to handle the label imbalance problem
how to extract features from region of interests.
Mulit Label의 경우 imbalance의 정도가 심할 수 밖에 없다. 고양이 - 사람과 사람 - 비행기의 조합은 많아도 고양이 - 비행기 조합은 압도적으로 적을 수 있기 때문
더불어 어떤 위치(문장에서는 어떤 단어)를 보고 해당 label 로 수렴해야 하는지도 쉽지 않은 과제이다.
Multi Label Classification은 보통 아래와 같은 방법론들로 접근하며 이 때문에 위의 두 문제점이 발생한다고 한다.
it usually trains a batch of separate binary classifiers with each designed for recognizing a particular class, which may lead to severely imbalanced numbers of positive and negative samples especially when the number of classes is large.
The latter problem is because of the distributed objects, i.e., an image often has multiple objects at different locations – a globally pooled feature as normally used in single label classification may dilute the features and make it hard to identify small objects