Boostcamp Day 29. 2021-03-04.
NLP에 관심이 많으신듯 하다. 굉장히 좋은 현상이다 나중에 P stage가면 아주 재밌고 많이 배울꺼 같다는 생각을 했다. 굉장히 뭐랄까 NLP는 불확실성과 애매모호함이 섞여있는 분야라서 그런지 마스터님의 답변이 이해가 안될때도 있고 도움이 될때도 있었던거 같다.
저작권 관련해서는 생각보다 주의를 많이 해야한다고 생각이 들었다. 일전에 CNN 실습때 크롤링을 돌려서 셀레니윰과 구글 드라이브로 300장 이상의 테슬라, 현대 제네시스 차를 크롤링 했다. 주의가 필요한듯하다. 그리고 뉴스 기사가 저작권이 쎄다는게 쫌 충격이였다. 다음에 기회가 된다면 공공데이터나 판례, 법 관련 데이터를 다뤄볼 수 있으면 좋겠다는 생각을 했다.
그 외
예전에 했던 Kaggle Titanic 코드를 읽어 보았다. 3년전에 했던거라 기억이 하나도 안난다. 심각하다. 그래서 코드를 다시한번 읽어 보았고 어느정도 감을 만드는 중이다. score 1(100%) kernel code 를 내일 같이 한번 살펴봐야 겠다. 무엇이 다르고 어떤 부분에서 성능차이가 있었는지 확인해 봐야겠다. 그리고 대회 전에 Play ground를 하나 참여해서 해봐야겠다. 아니면 데이콘에 새로 월간 시리즈가 생겼는데 그것도 좋을꺼 같다.
학습정리 블로그를 밀려왔는데 얼른 다시 따라잡아서 잘 정리해야 겠다고 생각한다. 복습할겸 다시 한번 보고 Further read나 관련 자료를 많이 읽어보고 내것으로 만들어야 겠다. 제일좋은건 논문 구현인데 엄두가 나질 않는다. 어떻게 해야할까.