과제 개요
다양한 디지털 도구는 사용자가 시각적으로 데이터셋을 탐구하고 데이터에 대한 가설을 확인하거나 부인하는 데 도움을 주도록 디자인되었습니다. 이 과제에서 해야 할 일은 현존하는 시각화 도구를 사용해서 여러분이 선택한 데이터셋에 대한 특정한 질문들을 만들고 대답하는 것입니다. 그 질문들에 대답한 뒤, 다른 사람들에게 그 질문에 대한 답을 나타내도록 디자인된 최종 시각화를 만들어내야 합니다. 여러분이 물어본 모든 질문들과 시작부터 끝까지의 과제 수행 과정을 문서화한 디지털 노트북을 가지고 있어야 합니다. 이 과제의 목표는 탐색적인 데이터 분석을 수행하기 위해 시각화를 사용하는 과정을 더 잘 이해하는 것입니다.
1 단계. 여러분이 관심 있는 도메인과 데이터셋을 선택하세요.
- 여러분이 가장 관심 있는 분야의 데이터셋을 고르세요.
2 단계. 여러분이 대답하고 싶은 초기 질문을 던져보세요.
- 예를 들어: 녹는점과 원자 번호 사이에 관계가 있나요? 별의 밝은 정도와 색깔이 서로 연관이 있나요? 인간 DNA의 서로 다른 부분에 있는 뉴클레오티드에 서로 다른 패턴이 존재하나요?
3 단계. 질문에 답하기 위한 데이터의 적합성을 평가합니다.
- 데이터를 검사합니다–데이터의 원시 값을 먼저 보는 것은 항상 도움이 됩니다. 데이터가 여러분의 질문에 답하기에 적합한가요? 아니라면, 위의 과정을 다시 시작하는 것이 좋습니다. 그렇다면, 데이터를 분석하기 전에 다시 형식을 맞추거나 정제할 필요가 있나요? 시각적 분석을 하기 전에 원하는 모습으로 데이터를 얻기 위해 필요한 모든 단계를 진행하세요.
과제 안내:
- Google Co-lab 혹은 주피터 혹은 제플린 혹은 d3.js를 사용하세요 – 인터랙티브 시각화를 하는 어떠한 노트북이나 앱을 사용할 수 있습니다.
- 깃허브 저장소에 워크북을 저장하세요
- 어떠한 데이터셋이든 가장 창의적인 인터랙티브 시각화를 만든 세 명은 엄청난 환호를 받을 것입니다!고객/제품 매니저/C-레벨 임원진에게 여러분의 작업을 스토리텔링하고 설명하는 것은 데이터 과학자나 ML 엔지니어 포트폴리오의 필수적인 기술이 될 것입니다. 이 과제의 주요 목적은 그 기술을 발전시키기 위해서입니다.
제안합니다. 최종 보고서는 아래와 같이 작성해 보세요.
다음을 포함합니다:
- 스토리보드 – 이 데이터셋을 왜 선택했고 무엇을 이루려는 것인지를 포함합니다.
- 최소한 여러분이 선택한 네 가지 타입의 시각화와 더불어 차원이 축소된 시각화가 있어야 합니다.
- 여러분의 시각화는 자명해야 합니다.
- 애플리케이션의 소스코드도 포함해주세요. 제출된 주피터 노트북/애플리케이션이 순서대로 잘 동작하는지 확인하세요. 애플리케이션을 빌드하거나 실행할 때 특별한 안내가 필요하다면, 보고서에 포함시켜 주세요.
최종 보고서 평가 기준
다음 제시되는 기준을 토대로 평가해보세요.
과제의 필요사항을 정확히 충족한 프로젝트의 기준은 아래와 같습니다. 해야 하는 것보다 더 많은 것을 한 경우는 예를 들어:
- 세 개의 가장 창의적이고 인터랙티브한 시각화는 환호를 받을 것입니다.
- 고급 인터랙션 기술.
- 신경망을 사용하여 차원 축소를 보여준 경우.
- 멀티-뷰 코디네이션
- 생각을 많이 한 스토리보드.
- 다른 인터랙티브 시각화 도구를 사용한 경우 (예를 들어- d3.js)
다음과 같은 프로젝트는 좋지 않은 경우입니다:
- 에러가 있거나 작동하지 않을 경우
- 의문스러운 시각 인코딩
- 헷갈리는 인터페이스 디자인 혹은 도움이 되지 않는 인터랙션
- 탐색적 인터랙션 기술의 부재
- 불완전한 보고서
데이터셋 바로가기
-> 위 데이터 셋 리스트 중 일부는 저장소가 사라졌습니다. 아래 링크에 있는 데이터셋을 활용하세요!
comment