View Code? Open in Web Editor
NEW
DACON 한솔데코 질의 응답 처리 AI 경진대회 [2nd Prize]
Jupyter Notebook 100.00%
Python 0.01%
hs-llm-qna-chatbot's Introduction
Dacon 도배하자 Q&A 챗봇 : 한솔데코 시즌2 AI 경진대회 [2nd Prize]
- Data Preprocessing : 형식 오류 문장, 질문 간 유사도 동떨어진 문장 등을 확인 후 수정 및 대체하여 예외 문장 최소화
- Data Augmentation : GPT 증강 및 인덱스 Permutation 활용 문장 간 연결 증강
- Modeling : KoGPT2 Fine-Tuning, probabilistic sampling
- Validation : 증강 데이터 임의 추출하여 검증셋 생성, 검증답변 - 모델 생성답변 간 cosine 유사도 평균으로 모델 평가
- Refinement : 질문 - 답변간 유사도 확인하여 후보 답변 중 선택
- Application : RAG 방식 Vector DB 추가 활용 가능성
- OS: Linux-6.1.58+-x86_64-with-glibc2.35
- Google Colab GPU (학습 V100, 추론 T4)
pandas
: 1.5.3
numpy
: 1.25.2
torch
: 2.2.1+cu121
transformers
: 4.38.2
sentence_transformers
: 2.5.1
hs-llm-qna-chatbot's People
Contributors
Stargazers
Watchers