데이터 지능 팟캐스트, 교훈과 방향

데이터지능 팟캐스트가 10회를 맞이했다. 나는 프로그래머다 시절까지 계산하면 거의 1년을 팟캐스트에 보낸 셈이다. 처음에는 계속할 수 있을까 하는 고민이 있었지만, 이제 어느정도 자리가 잡혀가는 느낌이다. 그동안 방송 진행 및 운영을 도와준 분들, 그리고 옆에서 많은 응원과 피드백을 준 아내에게도 감사의 말을 전하고 싶다. 오늘은 그동안 팟캐스트라는 새로운 매체에 익숙해지면서 배우고 느낀 점을 써볼까 한다.

팟캐스트를 왜 하나?

그동안 일 이외에서는 블로그나 책을 써왔던 필자가 팟캐스트를 시작한 이유는 시간적인 이유가 컸다. 글을 쓰는 일은 상당히 오랜 시간동안 혼자 집중해야 하는데, 이는 첫 아이를 갖고 회사를 옮긴 2017년의 필자에게는 더이상 허용되지 않는 사치였다. 반대로 팟캐스트는 시간을 잡고 게스트와 녹음을 하면 되는 일이다. (적어도 필자는 그렇게 생각을 했다) 물론 시간이 들지만 적어도 소요시간이 정확한 일이니 부담이 적다.

게다가 글을 쓰는 일은 혼자 해야 하는데 비해, 팟캐스트는 다른 사람과 같이 하는 일이니 그만큼 동기부여가 된다. (글을 써보신 분이라면 아시겠지만 동기부여가 가장 큰 문제다.) 게다가 시애틀에서 샌프란시스코로 지역을 옮기면서 새로운 지역의 사람들을 만나보고 싶었던 필자에게는 팟캐스트를 만들어가면서 동종 업계의 전문가들을 만날 수 있겠다는 생각도 있었다.

작년에 회사를 옮기고 딸아이의 아빠가 되면서 시간적 여유는 많이 줄었지만, 그럴 때일수록 꾸준히 지식을 습득하고 다른 사람들과 교류할 수 있는 수단을 만들어야 한다고 생각했다. 데이터 과학, 특히 인공지능 분야의 눈부신 발전을 따라잡기 위해서는 현직에서 일을 하더라도 꾸준히 관련 분야의 지식을 넓혀야 하기 때문이다. 팟캐스트는 이런 배움의 과정을 널리 공유하여 더 의미있게 만드는 수단이었다.

팟캐스트에서 배운 점

그렇게 시작한 데이터지능 팟캐스트가 이제 횟수로 10회를 마쳤다. 그동안 기계학습, 딥러닝, 시각화 등 데이터 과학의 여러 세부 분야, 그리고 금융, 교육 등 데이터 과학의 여러 응용 분야에 관한 이야기를 나누었다. 필자가 관심을 가지고 있는 여러 분야의 전문가들을 모셔다가 팟캐스트를 녹음하는 것은 즐거운 일이었고, 스스로도 지식을 넓힐 수 있는 계기가 되었다. 시간적으로도 녹음 준비 및 편집을 익히는데 처음에는 시간 소요가 많았지만 차츰 익숙해졌다.

그렇다면 데이터지능 팟캐스트는 누가 얼마나 청취할까? 이를 이해하기 위해 다양한 플랫폼에서 제공하는 데이터를 종합해 보았다. 팟캐스트라는 단어는 이제 구독형 오디오 컨텐츠의 대명사처럼 쓰이지만 실제 구독은 애플 팟캐스트 앱, 팟빵, 팟티, 네이버 오디오클립 등 다양한 채널로 이루어진다. 아래 데이터에 따르면 국내에는 아직도 팟빵이 가장 널리 쓰이는 플랫폼인것 같다.

우선 데이터지능 팟캐스트의 청취자 수는 1월 말 기준으로 누적 다운로드 횟수 35000건, 회당 평균 3000건, 최대 다운로드 횟수는 5500건에 달했다. 네이버 오디오클립 등 일부 플랫폼에서의 청취 횟수가 포함되지 않은 통계이며, 애플의 통계에 따르면 다운로드 횟수에서 구독자의 비율은 약 86%정도니 총 구독자 수는 약 5000명 정도로 추산된다.

청취자들을 좀더 이해하기 위해 ‘딥러닝편’을 앞두고 청취자들의 직업에 대한 설문조사를 진행했다.  ‘딥러닝편’에 편중된 결과이기는 하지만, 학생, 개발자, 연구직 종사자 들이 주 청취자층을 형성하고 있었다. 페이스북의 관련 그룹에서 설문조사한 내용이라 편향이 있겠지만, 좀더 전문적인 내용을 원하는 청취자층을 갖고 있다.

방송 다운로드 횟수가 양적인 성장을 의미한다면 사용자들이 얼마나 방송을 흥미있게 듣는지를 평가하기 위한 지표로 실제로 얼마나 오래 방송을 듣는지를 측정해볼 수 있을 것이다. 최근까지 이에 대한 통계자료는 전무했으나, 작년 말 애플이 여기에 대한 부분적인 데이터를 제공하기 시작했다. 아래 차트는 애플에서 제공하는 최신 iOS 사용자들을 대상으로 총 방송 길이 대비 청취 시간 데이터이다.

위 그래프에서 눈에 띄는 점은 우선 방송의 총 길이에 관계없이 실제 청취 시간은 약 40분 정도라는 점이다. 방송의 총 길이가 긴 경우 조금 청취 시간이 늘어나지만 별 차이는 없다. 방송 컨텐츠를 최대한 전달하기 위해서는 한시간이 넘어가는 긴 방송을 올리는 것은 피해야함을 알 수 있다. 현재까지 방송간 청취율의 차이는 크게 발견하지 못했다. 설문조사를 통해 주관적인 만족도를 평가하는 것도 시도했으나 아직 의미있는 데이터를 수집하지는 못했다.

팟캐스트의 미래

이제 미국에서는 전 인구의 10%가 매일 팟캐스트를 듣는다는 통계도 있지만 팟캐스트는 아직도 젊은 플랫폼이다. 팟캐스트라는 플랫폼을 사실상 만든 애플은 작년 말 팟캐스트에 대한 분석 자료를 제공하기 시작했고, 아직 팟캐스트에 대한 제대로 된 광고/수익화 플랫폼도 없다. 이런 절름발이(?) 상태로도 팟캐스트가 이만큼 성장한 것을 보면 앞으로 잠재력이 크다고 볼 수도 있겠다.

특히 우리나라의 팟캐스트는 아직도 뉴스 등 가벼운 컨텐츠가 중심으로, 각 분야의 전문가들이 직접 현장에서 일어나는 이야기를 하는 방송은 많지 않다. 하지만 출퇴근 시간 등 자투리 시간을 활용하여 뭔가 배우려는 수요는 항상 있고, 블로그가 그랬듯이 더 많은 사람들이 팟캐스트를 만들고 듣게 되리라고 생각한다.

아직 갈 길이 멀지만, 데이터 전문가들의 이야기를 대중에게 전달할 수 있는 채널을 만들었다는 점에서 필자는 보람을 느낀다.아직 여러가지로 부족함이 많은 데이터지능 팟캐스트를 이렇게 많은 분들이 들어주신다는 점은 고무적이다.

그동안 회사와 육아를 병행하며 격주로 방송을 녹음해 올리기에도 바쁜 일정이었지만 시간이 허락하는 한 더 좋은 방송을 만들기 위해 노력할 생각이다. 오디오 콘텐츠라는 특성상 팟캐스트를 잘 하기 위해서는 다양한 스킬이 필요하다. 우선 방송을 진행하는 순발력과 게스트의 이야기를 최대한 끌어내는 방법인 인터뷰 스킬에 대한 책을 읽고 있는데, 앞으로 방송에 최대한 적용해보고 싶다.

올해 초부터는 이왕 할거만 제대로 해보자는 생각에 운영진도 꾸리고 홈페이지와 로고도 만들었다. 청취자 분들이 소통할 수 있는 공간인 커뮤니티도 만들었다. 필자의 비전에 공감해 편집 및 커뮤니티 운영을 도와주는 최재완, 김영웅님께 다시 한번 감사드린다. 헬로 데이터 과학 때부터 많은 도움을 주신 한빛 미디어에서 올해부터 데이터지능 팟캐스트의 운영 자금을 후원해주고 계시다.

또한 팟캐스트를 바탕으로 다양한 컨텐츠를 만드는 방안도 고민중이다. 팟캐스트 대본/녹취록을 편집하고 보강하여 글로 만드는 방법도 있고, 팟캐스트의 출연진이 좀더 심도있는 비디오 강의와 같은 컨텐츠를 만드는 방법도 있다.

데이터지능 팟캐스트 E10 : 데이터 시각화 특집 – 김묘영님

현직 전문가들이 들려주는 데이터와 인공지능 이야기 데이터지능 팟캐스트 10번째 에피소드 “데이터시각화 특집”

데이터를 공부하거나 분석하는 과정에서 시각화에 대한 고민을 피할 수는 없을 것입니다. 좋은 데이터 시각화와 나쁜 데이터 시각화는 무엇을 말하는 것일까요? 분석만큼 중요한 시각화의 기술.

바이스버사 디자인 스튜디오의 대표이자 좋아 보이는 것들의 비밀: 인포그래픽 저자이신 김묘영님을 모시고, 김영웅님과 함께 데이터시각화와 인포그래픽에 대한 이야기를 나누어 봅니다.

본 방송은 YouTube 생방송으로 진행되었었습니다. 방송에서 소개되는 시각화 자료 등은 아래 링크에서 확인하실 수 있습니다.

Episode 10-1

Episode 10-2

■ 방송 관련 자료 ■

데이터 지능 팟캐스트는 믿고 보는 출판사 한빛미디어에서 후원합니다. 방송에 대한 의견이나 출연 요청 및 기타 궁금증은 저희 홈페이지 data-intelligence.io를 방문해주시면 됩니다.

데이터지능 팟캐스트 E9-2 : 딥러닝 프레임워크 및 활용 – 김성진님, 김진중님

김성진님 (3분 딥러닝 케라스맛) & 김진중님 (3분 딥러닝 텐서플로맛) 그리고 테리님과 함께하는 딥러닝 프레임워크 및 활용편 2부를 공개합니다!

  • 딥러닝 프레임웍의 최근 이슈와 트렌드에는 어떤 것이 있을까요?
  • ‘어떤 상황에는 어떤 프레임웍을 써라’ 이런 레시피가 있을까요?
  • 케라스 vs 텐서플로 vs 파이토치 중 한가지만 배워야 한다면 무엇을?
  • 최근에 했던 딥러닝 프로젝트를 소개한다면? 어떤 보람과 어려움이 있었는지?
  • 딥러닝을 시작하는 사람들에게 해주고픈 이야기가 있다면? (DO & DON”T)
  • 딥러닝 프레임웍의 미래는? 모든 것이 자동화되는 AutoML이 답인가?

Download this episode (right click and save)

방송 관련 자료

데이터 지능 팟캐스트는 믿고 보는 출판사 한빛미디어에서 후원합니다. 방송에 대한 의견이나 출연 요청 및 기타 궁금증은 저희 홈페이지 data-intelligence.io를 방문해주시면 됩니다.

데이터지능 팟캐스트 E9-1 : 딥러닝 프레임워크 및 활용 – 김성진님, 김진중님

김성진님 (3분 딥러닝 케라스맛) & 김진중님 (3분 딥러닝 텐서플로맛) 그리고 테리님과 함께하는 딥러닝 프레임워크 및 활용편 1부를 공개합니다!

  • 딥러닝 프레임웍의 최근 이슈와 트렌드에는 어떤 것이 있을까요?
  • ‘어떤 상황에는 어떤 프레임웍을 써라’ 이런 레시피가 있을까요?
  • 케라스 vs 텐서플로 vs 파이토치 중 한가지만 배워야 한다면 무엇을?
  • 최근에 했던 딥러닝 프로젝트를 소개한다면? 어떤 보람과 어려움이 있었는지?
  • 딥러닝을 시작하는 사람들에게 해주고픈 이야기가 있다면? (DO & DON”T)

방송 관련 자료

데이터 지능 팟캐스트는 믿고 보는 출판사 한빛미디어에서 후원합니다. 방송에 대한 의견이나 출연 요청 및 기타 궁금증은 저희 홈페이지 data-intelligence.io를 방문해주시면 됩니다.

E8-2 음악 데이터로 창업하기: 차트메트릭 대표 조성문님

데이터를 기술로만 접하신 분들께는 데이터를, 그것도 대부분 공개된 데이터를 가지고 비즈니스를 만들 수 있다는 사실이 놀라우실 겁니다. 지난 회에 이어서, 이번 방송은 실리콘벨리의 안정된 커리어를 뒤로 하고 본인이 열정을 가진 뮤직 데이터 비즈니스에 뛰어든 조성문님의 데이터와 비즈니스 이야기 두번째 편을 전합니다.

조성문님 개인 홈페이지: https://sungmooncho.com/
차트메트릭 홈페이지: https://chartmetric.io/


데이터 지능 팟캐스트는 믿고 보는 출판사 한빛미디어에서 후원합니다. 방송에 대한 의견이나 출연 요청 및 기타 궁금증은 저희 홈페이지 data-intelligence.io를 방문해주시면 됩니다.

E8-1 음악 데이터로 창업하기: 차트메트릭 대표 조성문님

데이터를 기술로만 접하신 분들께는 데이터를, 그것도 대부분 공개된 데이터를 가지고 비즈니스를 만들 수 있다는 사실이 놀라우실 겁니다. 데이터지능 이번 방송에서는 실리콘벨리의 안정된 커리어를 뒤로 하고 본인이 열정을 가진 뮤직 데이터 비즈니스에 뛰어든 조성문님의 데이터와 비즈니스 이야기를 전합니다.

조성문님 개인 홈페이지: https://sungmooncho.com/
차트메트릭 홈페이지: https://chartmetric.io/


데이터 지능 팟캐스트는 믿고 보는 출판사 한빛미디어에서 후원합니다. 방송에 대한 의견이나 출연 요청 및 기타 궁금증은 저희 홈페이지 data-intelligence.io를 방문해주시면 됩니다.

데이터지능 팟캐스트의 2018년

데이터지능 팟캐스트가 시작된지 두달이 되었습니다. 그동안 각 분야의 훌륭한 게스트 분들을 모셔서 흥미로운 이야기를 나누는 것만으로 행복한 시간이었습니다. 그동안 방송을 빛내주신 테리님 및 게스트 여러분, 방송에 음양으로 도움을 주신 지인 여러분, Last but not least 청취자 여러분들께 감사의 말씀을 전합니다.

몇가지 방송 관련 업데이트를 드리자면 2018년부터 데이터 지능 팟캐스트는 한빛미디어에서 후원해주시기로 하셨습니다. 앞으로 매회 데이터과학 및 인공지능 관련 신간이 있으면 방송에서 소개하도록 하겠습니다. 또 하나, 저희 방송에서 운영진 두 분을 모시게 되었습니다. 방송 편집 담당에 최재완님, 그리고 방송 커뮤니티 운영을 담당하실 김영웅입니다.

그리고 방송 관련된 자료를 한곳에 모아서 보실 수 있도록 저희가 방송 홈페이지를 만들었으며, 앞으로 청취자 및 출연자를 위한 커뮤니티를 운영하려고 합니다. 커뮤니티는 청취자와 출연자가 소통하는 공간으로 운영하고, 방송 생방송 등 다양한 방송 관련 이벤트 공지가 올라갈 예정입니다.

@ 데이터지능 커뮤니티: https://www.facebook.com/groups/dataintelligence

마지막으로, 저희가 2018년 더 좋은 방송을 만들기 위해 여러분들의 고견을 듣고자 합니다. 많은 응답 바랍니다!

@ 데이터지능 청취자 설문조사: https://goo.gl/Bp7a6w

-데이터 지능 운영진 드림

E7 데이터지능 팟캐스트의 2017년

데이터지능 팟캐스트가 시작된지 두달이 되었습니다. 그동안 각 분야의 훌륭한 게스트 분들을 모셔서 흥미로운 이야기를 나누는 것만으로 행복한 시간이었습니다. 그동안 방송을 빛내주신 테리님 및 게스트 여러분, 방송에 음양으로 도움을 주신 지인 여러분, 마지막으로 청취자 여러분들께 감사의 말씀을 전합니다.  이번 방송/글에서는 2017년 방송의 하이라이트를 돌이켜볼까 합니다.

E2 기계학습의 실무 (구글 리서치 김승연님)

머신러닝을 학문적 주제로 접근하는 경우가 많은데, 현실 세계의 머신러닝에는 데이터도 늘 변하고, 시스템과 코드에도 항상 문제가 생기는 어려움 하에서도 좋은 결과를 내야 하는 어려움이 있습니다. 구글 리서치에서 모바일 환경의 기계학습을 연구&개발하시는 김승연님과 함께 현실 세계의 머신러닝이 갖는 어려움, 그리고 머신러닝을 실무에 적용하기 위한 단계별 유의사항을 알아보았습니다.

일반적으로 머신러닝은 지속적인 유지보수를 필요로 하는데, 전통적인 솔루션보다 비용이 더 소요될 수 있어요. 머신러닝은 결국 더 복잡한 시스템을 만들게 되잖아요. 그러면 그렇게 복잡한 시스템을 유지보수 하기 위한 사람들을 계속 충원 해야 하는데 과연 그 사업이 그만한 가치가 있느냐가 중요하죠. 머신러닝이 모든 것을 마법처럼 해결한다기보다 고급 도구로 생각하고 유용성을 판단해서 도입하는 것이 좋을 것 같습니다.

데이터는 머신러닝을 동작시키는 연료같은 존재이죠. 연료가 좋지 않으면 성능도 좋지 않겠죠. 데이터가 너무 적어도 문제이고 많아도 문제이고 너무 치우쳐도 문제예요. 많으면 성능이 나올 때까지 시간이 오래걸리는 것이 문제죠. 적당히 솎아내야 하는데 적당히 솎는 것도 문제죠.

실무에서는 유지보수가 사실 가장 앞에 나와야 해요. 실제 일을 하면 구현 30/ 유지보수 70 정도로 유지보수가 어려워요. 왜냐하면 구현할 때 사람들이 생각보다 많은 가정을 하거든요. ‘이 상태에서는 이런 형식의 데이터가 들어온다’ 라던지 ‘이 다음은 OS에서 이렇게 scheduling을 하겠지’ 처럼요. 다 이렇게 되면 다 망해요. 왜냐하면 현실은 예외적인 상황이 많기 때문에 처음부터 모든 상황을 다 대비할 수가 없어요.

E3 생활 속 데이터 분석 (우아한 형제 권정민님, 카카오 최규민님)

데이터 일을 하면서 얻는 스트레스를 데이터로 푼다? 자기관리를 위한 데이터를 모은다? 데이터 과학자들은 조금 특별한 사람들일까요? 이번 방송에서는 생활 속에서 데이터를 모으고 분석하는 취미를 갖고 계시는 현업 데이터 과학자 두분을 모시고 말씀을 나누어 보았습니다. 데이터 활용을 이렇게 생활화하는 것이 데이터 전문가로 가는 지름길이 아닐까 생각해 봅니다. 

최규민: 저는 생활데이터 분석이 일단 재미있더라구요. 생활데이터 분석을 할때는 주로 뭔가 느슨해질때 주변의 소소한 것들을 관찰하다가 뭔가 재미있는 것을 발견하면 집에 빨리 가서 뭔가 하게되요. 그런게 제가 생활데이터 분석에서 얻는 의의같아요.

권정민: 저는 자기관리 차원에서 다양한 데이터를 모아요. 요즘은 세상이 좋아져서 다양한 앱이나 도구를 가지고 소위 제 상태를 모니터링 해요. … 예전에 작은 컨퍼런스에서 제 잉여력을 관리하는 법에 대해 발표한 적이 있는데, 그게 말하자면 제가 SNS에서 뭘 하는지, 운동은 어떻게 하는지 그런 것들이죠. … 제가 발견한 것들은 스트레스를 받을때 수면 퀄리티가 떨어진다던가, 독서량이 줄어든다던지 이런 결과가 나타나죠.

E4 데이터 사이언스 커리어 및 에듀텍 (유데미 시니어 디렉터 한기용님)

글로벌 교육 서비스 회사 유데미의 데이터 활용 과정에는 어떤 이슈가 있고, 유데미의 데이터 팀을 이끌고 계신 한기용님이 데이터 과학에 대해 어떤 조언을 주실까요?  개인적으로 서비스를 평가하는 지표 디자인에 관심이 많은데, 온라인 교육 서비스를 평가하는 지표 그 중에서도 유데미에서 사용하는 지표는 또 다르다는 점을 알 수 있었습니다.

Airbnb에서 가장 잘 하는 host가 Airbnb에서 guest를 경험해본 사람이라고 하더라고요. Guest로 여러 Airbnb 숙소를 경험하다보니 자신이 좋은 경험을 줄 수 있는 숙소의 host를 하게되는 것처럼 Udemy에서도 본인이 여러 강좌를 듣다보니 좋은 강의를 만들 수 있게되어 개설하는 분들이 가장 활발하고 열심히 활동하고 그런 분들을 추적하는 지표도 따로 있어요. Site-switching ratio라고 해서 학생으로 시작한 사람들이 강사가 되는 비율, 강사로 시작한 사람들이 학생이 되는 비율 두가지를 모두 다 보죠. Marketplace에서는 이 두가지가 굉장히 중요한 지표에요.

제가 Udemy에 입사하고 지난 3년간의 목표는 데이터 관련 인프라 구축하고 팀빌딩하고 e-commerce 같이 생산자와 소비자를 연결하는 부분이었고요, 향후에는 한 발짝 더 나가서 학생들이 정말로 배웠는지, 측정은 어떻게 할건지, 측정결과를 강사들이 개선하기 쉬운 형태로 전달하는 부분에 집중하고 싶어요. 다른 에듀텍 회사들도 모두 같은 고민을 하고 있는 것 같아요.

만약에 제가 대학생활로 돌아간다면 바꾸고 싶은 것이 한가지 있어요. 뭐냐면 제 멘토가 될 사람을 찾아보고 싶어요. 생각해보면 미국에 와서 최근까지도 멘토 없이 혼자 고민하고 결정을 내렸는데 만약에 대학생활이나 사회초년으로 다시 돌아가면 저한테 조언을 줄 수 있는 사람을 먼저 찾아보고 싶어요. 결정은 내가 내리더라도 마음 편히 물어볼 수 있는 인생선배가 있었더라면 더 잘 살고 있지 않을까 라고 생각하죠.


E5 금융 데이터 분석 & 퀀트의 세계 (권용진님, 《인공지능 투자가 퀀트》 저자)

흔히 생각하는 화려한 퀀트의 세계. 그 이면에는 끊임없이 변하는 시장과 경쟁자에 대응해야 하는 어려움이 상존합니다. 이번에는 현직 퀀트이시자 《인공지능 투자가 퀀트》 저자인 권용진님과 퀀트의 현재와 미래, 그리고 퀀트로 일하는 보람과 어려움에 대해 이야기를 나누어 보았습니다.

하지만 최근에는 데이터가 소셜 미디어 등 자연어 데이터를 많이 쓰므로 대용량 그리드나 클라우드를 많이 도입하게 되었어요. 그래서 인프라 개발자의 역량이 매우 중요해졌습니다. 예전에는 주로 회로 전문가가 득세했지만, 요즘에는 어떻게 하면 머신러닝 기술을 빠르게 돌릴 것인가가 초점입니다.. 일반 데이터 과학을 많이 하는 기술 회사에서 많이 쓰는 인프라를 많이 사용하게 됐습니다.

사실 퀀트 하시는 분들이 여기를 많이 진입하는 이유가, 돈을 자동으로 벌어주는 프로그램을 만들 수 있으면,  이런 프로그램 짜놓고 홍콩에서 매일 아침 잔고만 확인하며 편하게 산다는 이야기를 듣고 시작한다. 저도 사실 프로그램 한번 만들어 놓고 편하게 바닷가나 놀러다니고 싶다는 생각으로 시작했습니다. 그런데 실제로는 신경쓸게 매우 많습니다. 사실 아까 말씀드린대로 시장 상황이 급변하기 때문에, 이를 모니터링하는 사람을 따로 뽑는 경우도 많아요.


E6 딥러닝 in NIPS2017 (네이버 CLAIR 하정우 & 성낙호 & 이활석님 / 정지훈 경희사이버대학교 교수님)

요새 화두인 딥러닝. 하지만 제대로 공부하기 위해서는 고려해야 할 사항이 많습니다. NIPS 컨퍼런스에 참석하신  딥러닝 전문가 네분을 모시고 딥러닝의 트렌드와 이를 따라잡는 학습 방법에 대해 알아보았습니다. 같은 기술이라도 (GAN) 용용 목표에 따라 전혀 다르게 활용될 수 있다는 점, 그리고 딥러닝 커뮤니티의 활용이 학습에 중요한 부분이라는 인사이트를 주셨습니다.

정지훈: GAN관련해서는 저도 좀 이야기할게 있는데, 제가 도메인을 헬스케어와 문화, 즉, 음악이나 만화쪽도 다루어요. 그런데 같은 기술을 가지고도 사용하는 방법이 달라요. 의학 쪽에서는 성능을 높이는데 주안점을 둔다면, 문화 쪽에서는 소위 글로벌 옵티멈을 찾으면 안되거든요. 어느정도 최적해를 찾되 로컬 옵티멈에서 멈추는게 창의적인 결과가 나오거든요. 그러니까 같은 기술을 쓰더라도 의학을 하느냐 문화를 하느냐에 따라 활용 방식이 달라진다는 거죠. 제가 머신러닝 공부하시는 분들께 하고싶은 말씀은 내가 하려고 하는게 무엇이며 고객은 누구이며 어떤 가치를 만들고자 하느냐에 따라서 기술의 활용방법이 달라진다는 겁니다.

하정우: (딥러닝 학습법 관련) 저도 비슷한 의견인데 사실 너무 많은 논문이 나오고 빨리 변하고 있기 때문에 주변의 친구나 커뮤니티를 활용해야 최대한의 효과를 얻을 수 있습니다. 저희는 회사에서 세미나를 열심히 하는데 논문 하나하나를 깊이있게 본다기 보다는 핵심 아이디어가 뭐고 어떤 아이디어를 썼고 기존 연구와 어떻게 다른지만 짚어줘도 굉장히 도움이 되는 것 같아요. 요약하면 집단지성을 활용하시라는 겁니다. 


데이터 지능 팟캐스트 시즌1 소개

2017년, 인공지능을 필두로 데이터를 모으고 활용하여 가치를 만들어내는 방법에 대한 관심이 어느 때보다 뜨겁다. 이미 미국에는 데이터 과학 및 인공지능에 관련된 다양한 팟캐스트가 존재한다. 필자는 얼마전까지 ‘나는 프로그래머다’에서 데이터 관련 방송을 진행했는데, 최근 나프다의 종료와 함께 ‘데이터 지능’이라는 이름의 새로운 방송을 시작하려고 한다. 데이터 지능은 ‘데이터 과학’과 ‘인공 지능’을 조합한 단어로 ‘데이터에서 가치를 끌어내는 능력’이라는 의미도 있다.

‘데이터 지능(Data Intelligence)’은 데이터 과학과 인공지능에 종사하는 다양한 게스트를 초대하여 각 분야에 대한 소개와 트렌드를 알아보는 팟캐스트다. 데이터 과학 및 인공지능 분야에서는 끊임없이 새로운 분야가 생겨나고 기술이 쏟아져 나오는데, 이런 이야기를 현장의 전문가에게 직접 들을 수 있다면 큰 도움이 될 것이다. ‘데이터 지능’은 이처럼 국내외 데이터 관련 전문가들이 대중과 소통할 수 있는 채널이다.

또한 기존 팟캐스트는 전달수단(오디오)의 한계 등으로 깊이있는 이야기를 나누기 어려운데, ‘데이터 지능’은 출연자와 협의를 거쳐 팟캐스트와 연계된 콘텐츠를 번들로 묶어 제공할 계획이다.각 에피소드에 필요에 따라 동영상, 슬라이드, 코드가 포함되는 강의를 추가하여 오디오로 제한되는 팟캐스트의 한계를 뛰어넘는 심도있는 지식을 전달하는 것이다. 이를 위해 유데미(udemy) 등 다양한 파트너와 논의중이다.

나프다를 진행하면서 어떤 일이던 지속가능한 정도로 단순화하는 것이 중요하다는 점을 느꼈다. 이를 위해 데이터 지능은 불펼요한 편집 및 장식을 배제하고 데이터 과학과 인공지능에 관련된 다양한 이야기를 전달한다는 본질에 집중할 생각이다. 본인의 부족한 점을 청취자 분들이 차차 채워주시리라 믿는다. 아래 링크에서 테리님과 함깨하는 데이터 지능 팟캐스트 첫방송을 들으실 수 있다. 축하 인사 보내주신 권정민 & 김승연님께 감사 말씀 전한다.

업데이트 on 2/19/18: 10회를 맞아 방송에 대한 생각을 정리해 보았습니다.

데이터 지능 팟캐스트, 교훈과 방향