[IT 칼럼]데이터 사이언스, 왜 어떻게 가르쳐야 하는가
최근 대학들이 돌아가고 있는 걸 보면, 한국과 비슷하게 전반적으로 문과 학과들이 앞으로도 사회에 적절하고 유용할 수 있을지에 대한 위기감이 매우 높은 상태다. 얼마 전 캐나다 몬트리얼 인근에서 열린 한 학회에서 한 스탠포드 사회학과 교수를 만난 적이 있다. 스탠포드 학부생들이 컴퓨터과학에 대한 관심만 높고, 사회학 학부생 숫자가 갈수록 줄어들고 있다고 한탄했다. 필자가 재학 중인 UC 버클리의 경우도 많은 학생들이 본인의 1전공이 무엇이든지를 막론하고 컴퓨터과학을 이중 혹은 삼중 전공 중 하나로 택하려는 경향이 늘고 있다. 이런 수요를 반영해 UC 버클리에서는 2015년부터 데이터 사이언스를 연계전공 비슷한 개념으로 도입하여 학부 교육의 일부로 적용하고 있고, 관련 투자를 계속 늘리고 있다.
그리고 이렇게 컴퓨터 과학, 데이터 사이언스에 대한 관심이 높아지는 건 실리콘밸리에 근접한 이 두 학교에서만 일어나는 현상은 아니다. 다른 많은 대학에서도 사회과학 학과 중 통계학은 학부 전공자에게 의무수업으로 채택하고 있고, 문학·역사학 같은 순수 인문학 학과에서도 디지털 인문학이라고 해서 컴퓨터과학을 본인 분야에 적용하는 방법을 논의하고 있는 게 현재 미국 내 현실이다. 물론 모든 연구와 직업이 이런 대세를 따르고 있는 건 아니다. 그러나 점점 더 많은 분야가 그렇게 되고 있기 때문에, 미리 준비하지 않으면 뒤처질 수 있다는 위기감이 여러 학교에 퍼지고 있다.
학부 문과 전공자들이 졸업 후 앞날에 대해 답답하게 여기는 건 한국도 그렇게 크게 다르지 않은 만큼, 이런 흐름을 국내에 어떻게 적용할 수 있을지를 한 번 깊이 고민해보는 것도 의미가 있을 것이다. 다만, 여기서 미국 내에서 문과생에게 데이터 사이언스가 필요하다고 말할 때는 단순히 문과생이 코딩을 배워야 한다가 아니라, 자신의 분야 데이터에 대한 이해, 통계적인 사고, 컴퓨팅 사고, 세 개가 합쳐진 것을 말한다는 걸 주목할 필요가 있다. 예를 들어, 필자같이 정치학을 연구하는 사람이라면 가장 기본적인 선거, 여론 데이터가 어떻게 만들어지고, 어떻게 해석할 수 있는지를 이해할 수 있어야 한다. 나아가, 그런 이해는 데이터 수집(샘플링)과 분석(통계, 인과 추론)의 차원에서 많은 부분 통계적인 사고와 맞닿아 있다. 이런 일을 실제로 하는 건 주로 파이선, R과 같은 프로그래밍 언어를 통해서 하기 때문에 코딩을 할 수 있는 기술도 일부 필요하다. 달리 이야기하면, 데이터 사이언스를 가르친다는 건 데이터 수집, 분석, 그리고 표현에 대한 지식과 사고, 그리고 기술을 다 가르쳐야 한다는 걸 뜻한다.
이걸 당연히 한 학과에서 다 가르치는 건 불가능하다. 여러 분야의 전문가가 필요하기 때문이다. 또한, 학생들이 일일이 알아서 데이터 사이언티스트가 되기 위해 필요한 트레이닝을 받는 것도 쉽지 않다. 그렇기 때문에 데이터 사이언스를 제대로 가르치는 게 목적이라면, 문과생 코딩 가르치기를 넘어서야 하고, 학교 차원에서 학과를 넘어선 폭넓은 그리고 실제 경험을 쌓을 수 있는 기회를 제공해주기 위한 노력이 중요하다.
<김재연 UC 버클리 정치학과 박사과정>
그리고 이렇게 컴퓨터 과학, 데이터 사이언스에 대한 관심이 높아지는 건 실리콘밸리에 근접한 이 두 학교에서만 일어나는 현상은 아니다. 다른 많은 대학에서도 사회과학 학과 중 통계학은 학부 전공자에게 의무수업으로 채택하고 있고, 문학·역사학 같은 순수 인문학 학과에서도 디지털 인문학이라고 해서 컴퓨터과학을 본인 분야에 적용하는 방법을 논의하고 있는 게 현재 미국 내 현실이다. 물론 모든 연구와 직업이 이런 대세를 따르고 있는 건 아니다. 그러나 점점 더 많은 분야가 그렇게 되고 있기 때문에, 미리 준비하지 않으면 뒤처질 수 있다는 위기감이 여러 학교에 퍼지고 있다.
문과생에게 데이터사이언스가 필요하다는 것은 자신의 분야 데이터에 대한 이해, 통계적인 사고, 컴퓨팅 사고 세 개가 합쳐진 것을 말한다./위스콘신 대학교 River Falls
학부 문과 전공자들이 졸업 후 앞날에 대해 답답하게 여기는 건 한국도 그렇게 크게 다르지 않은 만큼, 이런 흐름을 국내에 어떻게 적용할 수 있을지를 한 번 깊이 고민해보는 것도 의미가 있을 것이다. 다만, 여기서 미국 내에서 문과생에게 데이터 사이언스가 필요하다고 말할 때는 단순히 문과생이 코딩을 배워야 한다가 아니라, 자신의 분야 데이터에 대한 이해, 통계적인 사고, 컴퓨팅 사고, 세 개가 합쳐진 것을 말한다는 걸 주목할 필요가 있다. 예를 들어, 필자같이 정치학을 연구하는 사람이라면 가장 기본적인 선거, 여론 데이터가 어떻게 만들어지고, 어떻게 해석할 수 있는지를 이해할 수 있어야 한다. 나아가, 그런 이해는 데이터 수집(샘플링)과 분석(통계, 인과 추론)의 차원에서 많은 부분 통계적인 사고와 맞닿아 있다. 이런 일을 실제로 하는 건 주로 파이선, R과 같은 프로그래밍 언어를 통해서 하기 때문에 코딩을 할 수 있는 기술도 일부 필요하다. 달리 이야기하면, 데이터 사이언스를 가르친다는 건 데이터 수집, 분석, 그리고 표현에 대한 지식과 사고, 그리고 기술을 다 가르쳐야 한다는 걸 뜻한다.
이걸 당연히 한 학과에서 다 가르치는 건 불가능하다. 여러 분야의 전문가가 필요하기 때문이다. 또한, 학생들이 일일이 알아서 데이터 사이언티스트가 되기 위해 필요한 트레이닝을 받는 것도 쉽지 않다. 그렇기 때문에 데이터 사이언스를 제대로 가르치는 게 목적이라면, 문과생 코딩 가르치기를 넘어서야 하고, 학교 차원에서 학과를 넘어선 폭넓은 그리고 실제 경험을 쌓을 수 있는 기회를 제공해주기 위한 노력이 중요하다.
<김재연 UC 버클리 정치학과 박사과정>
'사회 > edu' 카테고리의 다른 글
"줄세우기 의미 없다" 절대평가로 돌아가는 대학들 (0) | 2018.03.22 |
---|---|
[북리뷰]어떻게 창의성을 키울 것인가 (0) | 2018.01.07 |
[칼럼]인공지능 시대의 교육을 묻는다 (0) | 2018.01.06 |
열심히 공부하던 학생들도 어느 순간부터 학원에서 선행학습을 .. (0) | 2018.01.06 |
['시험사회' 문제를 풉시다](중)성적도 직업군도 이미 대물림..'시험 통한 출세'는 허상일 뿐 (0) | 2017.12.19 |