menu

2020 [데이콘] 포스트 코로나 데이터 시각화 경진대회 후기

  • date_range 30/07/2020 16:00 perm_identity 이재헌 조하늘 양정윤 고가연 info
    sort
    Contest
    label

대회 요약

주제

  • 포스트 코로나 시대 유망 품목 및 산업 발굴
  • 코로나로 인한 국민의 생활/소비의 변화 파악

목표

  • 포스트 코로나 시대 도움되는 인사이트 발굴

주최/주관

  • 주최 : KT
  • 주관 : 코리아스타트업포럼(AI i-CON), 데이콘
  • 후원 : 한국정보화진흥원(NIA)

대회 일정

사용 데이터

  • 유동 인구수 데이터
  • 카드 데이터
  • 배달 데이터
  • 품목 별 소비지수 데이터
  • 대한민국 COVID-19 현황에 대한 시계열 데이터

결과

최종 6위

결과물

참고시 꼭 출저를 밝혀주세요!

대회 후기

학교 시험이 끝난 뒤 시작한 첫 공모전 대회. 처음에는 수상을 못하더라도 경험 해보자라는 가벼운 마음으로 시작했다.

하지만 학교 시험때문에 늦게 시작한 만큼 시간이 빠듯했고 마감일이 다가오자 마음이 급해졌다.

가볍게 시작했지만 결과적으로 마음이 급해져 열심히 하게되었다. 대략 2주 동안은 이 공모전에만 집중한거 같았다.

그 결과 최종 성적표는 6위. 수상 마지노선인 5위와 4점차 6위를 해서 결과를 보고 좀 아쉬웠다.

개인적으로 최종 결과가 나오기전에는 최종 9~10등을 예상 했는데 기대 이상의 결과이기도 하였다. 아쉽기도 하지만 만족하기도 하는 아이러니한 순위였다.

최종 성적표를 받았으니 이제 간단한 후기를 이야기 해보려고 한다.

좋았던 점

  • 새로운 데이터

    코로나의 시대에서 살고 있지만 ‘포스트 코로나 시대’라는 주제에 대해서 생각해본적은 없었다.

    그렇기 때문에 ‘포스트 코로나 시대’라는 주제는 신선하고 흥미를 이끌 수 있는 주제였다.

    주제가 신선하고 흥미를 이끌어낸 만큼 공모전이 아니라면 쉽게 얻을 수 없는 데이터였다.

    특히, 카드 데이터나 배달 데이터는 회사가 아니면 접할 수 없는 데이터이기 때문에 이런 데이터를 다뤄볼 수 있다는 것은 좋은 경험이였다.

  • 실전 연습

    데이터 분석 공부를 하면서 항상 느끼는 것은 ‘책으로 공부하는 것과 직접 해보는 것은 다르다’ 였다.

    전처리를 하면서 사용되는 함수, 시각화 라이브러리, 분석 방법 등 알고는 있었지만 자주 사용해보지 않아 계속 찾아보면서 했었다.

    이런 과정을 여러번 반복하다보니 어느정도 익숙해졌다. 정말 내가 공부를 했다 말을 하려면 이런 과정이 여러번 필요하다고 생각한다. 그렇기 때문에 이번 공모전은 공부가 많이 되었다.

  • 비교 대상

    비교 대상이 있다는 것은 좋은 자극제가 되는 것 같다. 나름 열심히 한다고 했지만 다른 팀의 제출물을 보면 정말 잘했다는 생각이 많이 들었다. 그러면서 내가 많이 부족하다는 것을 느꼈고 스스로 채찍질하는 시간이 되었다. 다른 팀의 제출물을 보면서 내가 생각하지 못했던 방법, 시각화 방식, 아이디어 등 배울거리가 있었다. 책으로는 얻을 수 없는 배움이였다.

아쉬웠던 점

  • 투표 방식

    투표 방식의 논란은 이번이 처음이 아니였다. 그 전의 시각화 대회에서도 투표의 공정성의 문제가 제기되었다.

    이번에 레벨 마다 투표 점수가 다른 점, 10등 안에 들면 그 이후로는 심사위원이 점수를 매기는 방식을 도입했지만 아직 완벽한 방법은 아닌걸로 보인다.

    그래프가 올라오지도 않는 팀이 투표를 받는 것도 보았으며 몇시간 만에 순위권까지 올라오는 팀도 꽤 있었다(물론 잘해서 올라온 팀도 많았다).

    그리고 마지막 날은 올라가있던 투표수가 내려가는 등 과연 이게 공정한 방식인가?라는 의문은 지워지지 않았다.

  • 결과 발표

    결과 발표는 8.7 10:00시 였다. 하지만 당일 10:00시에는 결과가 올라오지 않았다.

    잠깐 늦는 건 이해할 수 있다. 하지만 결과가 올라온 시간은 17시 31분이였다.

    7시간 31분이 늦게 결과가 나왔다. 이 시간 동안 어떠한 공지도 없었고 메일을 보내도 답이 없었다. 또한 문의사항을 넣어도 답변이 없었으며 회사 번호도 없어 바로 문의도 되지 않았다.

    결국 7시간 31분을 늦게 올리고 끝났다. 어떠한 말도 사과도 없었다.

    데이터 분석 플랫폼으로 나름 한국에서 유명한 회사라고 생각했지만 이번 운영은 많이 실망스러웠다.

  • 추가적인 데이터

    데이터 분석을 하면서 ‘이런 데이터가 있으면 좋을텐데..’ 라는 생각이 많이 들었다.

    주어진 데이터로 분석을 하다보니 중간에 생각한 아이디어를 모두 표현하기 힘들었다.

    그래서 어떠한 데이터가 주어지냐도 중요하다는 생각이 들었다. 아무리 좋은 아이디어가 있어도 데이터가 없다면 표현할 방법이 없었다.

    크롤링이나 공개된 데이터를 가져와서 사용할 수 있었지만 마땅한 데이터를 찾지 못해서 아쉬웠다.

    ‘추가적인 데이터가 있었다면 내 생각과 논리를 더 보완할 수 있었지 않았을까’라는 아쉬움이 든다.

    다른 팀들을 보니 추가적인 데이터를 가져온 팀이 있었다. 데이터를 구하는 것도 능력인 것 같다.

느낀점

재헌

공부도 중요하지만 경험도 매우 중요한 것 같다. 이번 공모전을 하면서 멘탈이 흔들린적이 많았다.

메모리 에러, 이유모를 군집의 변동, 숫자 하나 실수로 전혀 다른 결과가 나온 것 등 공부만 해서는 얻을 수 없는 경험이였다.

또한, 다른 팀들을 보면 확실히 상위권 팀과는 갭이 있어보였다. 아직 많은 공부가 필요하다고 느꼈다.

현재 휴학을 앞두고 있는 상황에서 남은 1년 반이라는 시간을 잘 보내야겠다는 생각을 들게한 공모전이였다. 다음 공모전에는 내가 저 위치에 있길 바라며 마지막을 정리해본다.

정윤

처음으로 공모전을 나가보았다. 물론 내가 기획하여 주도적으로 팀을 이끌어간 것은 아니었지만 선배들은 어떤 방법으로 공모전에 참여하는지를 가까이에서 지켜볼 수 있어서 좋았다.

또한, 2020년의 키워드라고 할 수 있는 코로나에 대해서 자세히 생각해 볼 수 있는 시간이 되어서 의미 있었다. 코로나 이후, 어떤 점이 크게 변화할 것이고 소비 패턴이 어떻게 달라지는지도 시각화로 볼 수 있어서 신기하기도 했다.

2학년 2학기 때 배울 시각화를 미리 접해보아서 가장 좋았고 이번 기회로 특별한 경험도 하게 되어서 나에게는 큰 의미가 있는 첫 공모전이었다.

가연

처음에 만나서 재헌선배가 미리 하신 코딩을 변경해서 코딩을 해봤다. 단순히 일부만 수정해서 코딩하면 되는 거였는데, 그것에서부터 벽이 느껴졌다. 그런데 나중에 선배가 도와주시면서 치신 코드를 슬쩍 보니 1학기에 배운 거였다. 1학기에 열심히 살지 않은게 이렇게 드러나다니. 충격 그 자체였다. 그 날 그렇게 코딩에 제대로 데이고, 다음부터는 선배가 치신 코드가 조금씩 읽히기 시작했다. 그런데 아직 코드를 만들어 낼 정도까지는 아니었다. 그 탓에 코딩을 할 수는 없었다. 대신 꾸준히 코드에 대한 이해를 하려고 했고, 덕분에 마무리 지을 때 말을 만들어 내기가 쉬웠다. 이번 대회를 통해 데이터를 가지고 작업을 할 때 데이터에 대한 이해가 코딩실력만큼 중요하다는 걸 몸소 체험할 수 있었다. (작년 프로젝트를 하면서 찾은 커뮤니케이션 능력의 중요성을 직접 경험해보게 된 것.) 또한 지금까지 배운 코딩으로는 뭔가 대단한 걸 할 수 없겠다는 걸 알게 됐다. 그리고 “태블로”에 대해 배워보고 싶어졌다. 하늘언니가 태블로로 계속 멋진 시각화를 해내시는데, 그걸 보고 태블로의 매력에 빠져버린 것 같다. 또, 시각화란게 별거 아니라는 걸 알게됐다. 사실 그동안 시각화라고 하면 굉장히 대단한 것일 거라고 생각했는데, 그래프 만드는 것도 시각화에 해당된다고 하니 살짝 시각화라는 단어에 대한 환상이 깨졌고, 다가가기 쉬워(?)졌다. 그리고 데이터 베이스의 중요성을 느꼈다. 중간중간 데이터가 빈 게 있어 뭔가 만들어 낼 때 결측값이 자꾸 생겨 제약이 생겼었다. 앞으로 데이터를 모을 일이 생겼을 때 비지 않도록 주의해야겠다는 걸 느꼈다. 첫 대회를 선배들 아래서 함께 할 수 있어 좋았다. 비록 할 수 있는게 거의 없었지만… 마지막 ppt라도 만들었어야 했는데 그 조차 못해서 아쉬울 따름이다ㅠㅠ. 좀 더 실력적으로 여유가 되면 또 다른 곳에 도전해 봐야겠다.

하늘

약 한달간의 코로나 시각화 경진대회가 끝이났다. 투표를 받을 당시에는 10등안에 들지못하면 어쩌지? 하면서 마지막 제출당일에는 거의 10분 주기로 핸드폰을 확인했다.

처음엔 수상목적은 없었고, 시각화에 대한 경험을 쌓자는 취지로 도전을 하였는데 역시나 결과물이 나오고, 경쟁팀들이 하나씩 제출하는 것을 보며 조금은 욕심이 생겼었던것같다.

이번 공모전을 진행하며 크게 느낀 것은, 데이터를 사용하여 무엇을 보여줄지에 대한 뚜렷한 목적(그래서 결국 말하고 싶은 것)스토리 라인이 정말 중요하다는 것이었다. 데이콘 측에서 제공했던 데이터들을 사용해서 우리 팀이 이야기하고싶은 뚜렷한 목적이 무엇인지, 그리고 그 목적을 표현하기 위해 어떻게 스토리를 이어나가야 할지에 대한 고민을 많이 했던 것 같다.

데이터를 사용하며 코딩하고 태블로로 시트를 만들면서도 내가 지금 무엇을 이야기 하고싶은지, 어떤 주제를 가지고 이 시트를 만들고있는지에 대한 생각을 계속 되뇌이면서 만들려고 노력했다. 많은 데이터를 이용하여 하나의 스토리를 정해 남들에게 표현한다는 것은 정말 쉽지 않다는 것을 느낌과 동시에 그만큼 시각화의 힘은 강하다는 것또한 알게되었다. 가끔은 긴 코드들과 설명들보다 간략한 그래프가 더욱 강력하게 원하는 정보를 전달할 수 있겠다라는 것을 느꼈고, 그 만큼 데이터를 제대로 표현해야한다는 책임감또한 생겼던 것 같다.

아쉬웠던 점은 아무래도 공모전이었기 때문에 주어진 데이터 내에서만 고민을 한 것 같아서 그 점이 매우 아쉽다. 앞으로는 공모전이 아니더라도 실제로 어떤 문제에 대해서 깊이 고민해보고, 데이터에 맞게 주제를 생각하는것이 아닌 주제에 맞게 데이터를 직접 구하여 더 능동적으로 분석해보고싶다.

광고의 모든 수익금은 활동비로 지원됩니다.