WAI 에게 fitting되게 학습을 시키는 것보다 general하게 과학 개념을 학습시킨 모델로 WAI 데이터에 evaluation하는게 더 유의하지 않을까 ? → 성능은 어떨지 모르겠다

Negative sample 필요 케이스

<aside> 💡 WAI 데이터 → 답이 아닌 문장들의 다양성이 떨어짐

</aside>

유의어 이해하지 못하는 케이스

질문 위주의 문장이 많음