데이터사이언스, 어떻게 공부하고 프로젝트를 해야 할까?

패스트 캠퍼스 데이터사이언스 스쿨 2기 수료생 조용환님의 강의를 들었다. 데이터 사이언스 분야에 진입한지 2~3년 동안, 스스로 느낀 것, 주변 사람들로부터 질문 받은 것들을 가감없이 말씀해주셨다. 다음은 한 시간 반 가량의 강의를 들으면서 스스로 느낀 인사이트를 정리한 것이다. 어떻게 공부해야 할지, 어떻게 프로젝트와 포트폴리오를 준비해야 할지 정리하는 차원에서 작성했다.

1. 스터디, 어떻게 해야 할까?

(1) 친구, 동료와 함께

  • 데이터 분석은 결국 다른 사람들과 끊임없는 협업하는 과정이 동반될 수밖에 없다. 애초 공부할 때부터 다른 사람과 함께 하는 습관을 들이면, 훗날 협업할 때 도움이 될 것.
  • 팀 프로젝트, 수학 스터디를 중심으로 공부, 협업한다.

(2) 흥미를 놓지 않고

  • 데이터 사이언스 필드는 진입장벽이 높은, 많은 수련량/강도를 요구하는 분야이다. 스스로 흥미를 느끼지 못한다면, 이쪽 바닥에서 계속 남아있기 어렵다.
  • 일주일에 한 번씩, 나의 삶과 데이터 사이언스의 관계에 대해 글을 쓰며, 데이터 사이언스의 목적과 필요성을 상기한다.

(3) 나만의 패러다임을 구축하며

  • 기본기가 제대로 갖추어져 있지 않아도 업무는 수행할 수 있다. 그러나 수학, 알고리즘 등 기본기의 부족은 언젠가 발목을 잡을 것이다.
  • KOCW 이상화 교수님 강의, 3B1B 등 강의를 꼼꼼히 들으며 수학, 알고리즘(자료구조)을 밑바닥부터 천천히 갈고 닦는다.

(4) 명문화는 기본

  • 내가 알고 있는 지식 및 경험을 인출, 공유하는 능력은 필드에서 일할 때도 필요하다.
  • 프로젝트 진행, 포트폴리오 작성 때 작은 부분이라도 회고, 명문화, 공유한다.(데일리 커밋, TIL)

2. 프로젝트 / 포트폴리오는 어떻게 준비해야 할까?

(1) 취향을 저격하는

  • 기업은, 원하는 직무를 수행할 수 있는 능력(데이터 스킬 + 도메인 지식)을 보유한 사람을 원한다.
  • 기업의 취향을 저격할 수 있는 프로젝트를 진행하고, 포트폴리오를 준비한다.

(2) 근거에 기반한

  • 근거, 논리 기반 데이터 분석은 향후 개선할 수 있는 가능성이 크다.
  • 논문 쓰는 것처럼, 프로젝트의 의도, 주 타겟, 방법, 예상 결과, 결과, 피드백, 보완점 등을 근거을 기반을 두고 상세하게 서술한다.

(3) (데드라인 안에) 실질적 성과를 내는 포트폴리오

  • 프로젝트, 포트폴리오 안에서 성과를 내지 못하면 업무를 하면서도 성과를 내기 어렵다. 그러므로, 데드라인은 프로젝트 / 포트폴리오 작성에 있어 기본이다.
  • 관심 주제를 선택하고, 상대적으로 용이한 데이터 활용(eg. Kaggle)하여 실질적 성과를 낼 가능성을 높인다.

다음은 패스트캠퍼스 커리어서비스 강의에서 얻은 인사이트와 관련지어, 새내기 데이터사이언티스트는 어떤 산업, 어떤 기업에 어떻게 지원해야 할지 서술할 예정이다.