BERT로부터 문장 벡터를 얻는 방법은 여러 가지가 존재
그중 대표적인 3가지 방법
이는 CNN 방식에서 사용하는 Pooling과 동일하다
이때 평균 풀링을 하느냐와 맥스 풀링을 하느냐에 따라서 해당 문장 벡터가 가지는 의미는 다소 다른데, 평균 풀링을 얻은 문장 벡터의 경우에는 모든 단어의 의미를 반영하는 쪽에 가깝다면, 맥스 풀링을 얻은 문장 벡터의 경우에는 중요한 단어의 의미를 반영하는 쪽에 가깝다.
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks 라는 논문에서 처음 등장