Boostcamp Pstage_03 Day 04. 2021-04-29.
DAYLY LOG

Open-Domain Question & Answring

Contents

  • 목표/행동/회고


1. 오늘의 학습목표


2. 무엇을 (학습, 구현) 했는가

2-1. Peer-Session

2-2. TrainDataSet-validation data EDA

  • Train DataSet에서 validation에 사용되는 데이터들을 EDA 했다.
  • VALIDATION SET을 보는 이유는 TRAIN을 전체를 보기 힘들고 일단 애초의 목적은 팀원들과 함께 대략적으로 DATA의 내용을 살펴보자는 취지였다.
    • 모집단을 전수조사하기보단 표본을 조금이라도 보자는 의미에서..
  • Title이 겹치는 부분이 있고 겹치는 내용중에 context까지 동일한 데이터가 있고 Title은 같지만 context내용은 다른 data가 있다.
    • 전채 240개의 Data중에 12개의 Title이 겹치고 5개의 Context가 동일하다.
    • 이러한 데이터가 어떤 영향을 미칠지 직관적으로 와닿지 않는다. 내일 팀원들과 토론해봐야 겠다.


3. 아쉬운점


내일 할 것

  • 오늘 논문 읽은거 간단하게 나마 여기에 정리해서 올리기
  • BaseLine Code 숙지하기
  • PyCharm SSH Remote 설정하기
  • 남은 논문 마저 읽기
  • Daily Mission 3,4 하기



Reference

  • bootcamp AI Tech pdf.
  • NAVER Connect Foundation.