LGE AICC 23년 1월 실제콜 테스트 준비 | Notion

검증셋

데이터 설명
원본 파일 경로
- /ex_disk/soonpil/data/real_test_data/23년_real_test_600건.xlsx
변환 파일 경로
- 원본의 발화 구분(줄바꿈) 문자 | 는 \\n 으로 치환하였음
- 전체 604건 (stt_text 컬럼 N/A 3건은 BLANK_TEXT 로 치환함)
  - /home/soonpil/ex_disk/soonpil/data/real_test_data/real_test_20230116.tsv
  - /home/soonpil/ex_disk/soonpil/data/real_test_data/real_test_20230116_preprop_seed1.tsv
- 글자수 20 미만 삭제 후 591건
  - /home/soonpil/ex_disk/soonpil/data/real_test_data/real_test_20230116_qualified.tsv
  - /home/soonpil/ex_disk/soonpil/data/real_test_data/real_test_20230116_qualified_preprop_seed1.tsv
주피터 노트북 작업 파일

covert_real_test_230116.ipynb

학습 데이터 개수

데이터	감성+VOC여부	감성	VOC여부	상담유형+VOC유형(복수레이블)	상담유형	VOC유형
Train(기존)	29070 (14535 * 2)	14535	14535	22054 (16834 + 5220)
Train(STT aug.)	40448 (22024 * 2)	20215	20197	31381
Train(STT aug.+160건)	40768 (20384 * 2)	20375	20357	-	-	-
Test	3230 (1615 * 2)	1615	1615	2578 (1934 + 644)

Test 성능 및 검증셋 예상 성능

감성분류+VOC여부분류 Multi-task 모델

모델	Test 1615건(감성)	Test 1615건(VOC여부)	검증셋 604건(감성)	검증셋 604건(VOC여부)
모델#1: Multi-task + STT aug	93.56%	95.17%	96.19%	91.39%
모델#1-1: 160건 추가 학습(LGE정답)	93.93%	95.54%	96.69%	94.70%
모델#1-2: 160건 추가 학습(LG AI정답)	93.99%	95.54%	96.69%	95.03%
모델: 160건 추가 학습(LG AI정답) + class_mask	93.69%	95.29%	93.21%	91.23%
모델: 160건 추가 학습(LG AI정답) + class_mask + same_prompt (EOS)	93.75%	94.74%	90.07%	86.09%

감성분류 / VOC여부분류 Single-task 모델

모델	Test 1615건(감성)	Test 1615건(VOC여부)	검증셋 604건(감성)	검증셋 604건(VOC여부)
모델#2: Single-task + STT aug	93.25%	94.48%	96.19%	94.53%

상담유형분류+VOC유형분류 Multi-task 모델

OLD: 상담유형 11/29자, VOC유형 2023/01/04자 학습데이터

모델 경로 및 레이블 정보

모델	Test 1934건(상담유형)	Test 644건(VOC유형)
모델#1: Multi-task + STT aug	Top1: 73.74% / Top3: 91.31%	Top1: 56.99% / Top3: 80.75%
모델: Multi-task + STT aug + class_mask	Top1: 73.89% / Top3: 91.88%	Top1: 52.95% / Top3: 75.78%
모델: Multi-task + STT aug + class_mask + same_prompt (unused6)	Top1: 73.78% / Top3: 91.68%	Top1: 53.73% / Top3: 76.56%

상담유형 2023/02/17자, VOC유형 2023/02/07자 학습데이터
- 모델 경로 및 레이블 정보
모델 Test 1934건(상담유형) Test 644건(VOC유형)

모델: Multi-task + STT aug + class_mask Top1: 75.03% / Top3: 91.78% Top1: 51.85% / Top3: 78.24%