Boostcamp Pstage_03 Day 04. 2021-04-29.
DAYLY LOG
Open-Domain Question & Answring
Contents
- 목표/행동/회고
1. 오늘의 학습목표
2. 무엇을 (학습, 구현) 했는가
2-1. Peer-Session
2-2. TrainDataSet-validation data EDA
- Train DataSet에서 validation에 사용되는 데이터들을 EDA 했다.
- VALIDATION SET을 보는 이유는 TRAIN을 전체를 보기 힘들고 일단 애초의 목적은 팀원들과 함께 대략적으로 DATA의 내용을 살펴보자는 취지였다.
- 모집단을 전수조사하기보단 표본을 조금이라도 보자는 의미에서..
- Title이 겹치는 부분이 있고 겹치는 내용중에 context까지 동일한 데이터가 있고 Title은 같지만 context내용은 다른 data가 있다.
- 전채 240개의 Data중에 12개의 Title이 겹치고 5개의 Context가 동일하다.
- 이러한 데이터가 어떤 영향을 미칠지 직관적으로 와닿지 않는다. 내일 팀원들과 토론해봐야 겠다.
3. 아쉬운점
내일 할 것
- 오늘 논문 읽은거 간단하게 나마 여기에 정리해서 올리기
- BaseLine Code 숙지하기
- PyCharm SSH Remote 설정하기
- 남은 논문 마저 읽기
- Daily Mission 3,4 하기
Reference
- bootcamp AI Tech pdf.
- NAVER Connect Foundation.