빅데이터전문가

통계학과

빅데이터전문가란?

현대인은 일상 속에서 인터넷이나 스마트폰을 이용해서 실시간으로 수많은 사람들과 소통하거나 자신의 흔적을 남깁니다. 글을 게시하고 문자 메시지를 주고받거나 동영상을 공유하는 등 다양한 SNS(Social Network Service) 활동을 하게 되는데, 이러한 활동 내용들은 고스란히 데이터로 저장됩니다. 저장된 데이터들을 분석해 보면 그 사람의 성향이나 취미, 생각과 의견, 생활 습관, 상품 구매 성향 등을 상세하게 파악할 수 있습니다. 이와 같이 인터넷이나 SNS, 스마트폰에 저장된 모든 데이터를 빅데이터라고 합니다. 더 나아가 세상에 존재하는 모든 정보가 빅데이터라고 볼 수 있습니다. 
빅데이터는 지금까지 우리가 그 존재를 인식하지 못했을 뿐이지 존재하던 정보로, 새롭게 등장한 것이 아닙니다. 빅데이터는 디지털 환경에서 빠르게 증가하여 그 규모도 매우 크지만, 데이터가 만들어지는 주기가 짧고, 속도도 빨라지고 있습니다. 전문가들은 빅데이터를 ‘정보화 사회의 보물’이라고 말합니다. 이는 정보화 사회에서 빅데이터만큼 중요한 정보는 없다는 뜻입니다. 그 결과 빅데이터를 분석해 가치 있는 정보로 만드는 것이 국가나 기업, 개인에게 있어 중요한 관심사가 되었습니다.
빅데이터는 2012년 미국의 시장 조사 기관인 가트너 그룹이 세계 10대 기술로 선정하면서 더욱 관심을 받게 되었습니다. 오늘날 빅데이터는 우리가 생각할 수 있는 거의 모든 분야에서 다양하게 활용되고 있습니다. 자연재해로 인해 환경이 훼손되었을 때 새로운 도시 환경을 조성한다든지, 교통 관련 빅데이터 정보를 이용해 효율적인 도로 교통망을 구축한다든지, 소비자의 개인별 성향을 저장한 빅데이터를 이용해 기업의 마케팅에 활용한다든지 등 곳곳에서 활발히 활용되고 있습니다. 
세상에 존재하는 방대한 빅데이터를 분석해 부가 가치가 높은 정보로 만들어 내는 사람을 빅데이터전문가라고 합니다. 이들은 거대한 규모의 데이터를 목적에 맞게 수집·분석·활용하고, 데이터에 숨어 있는 정보나 일정한 패턴을 찾아내 현상을 분석하며, 데이터를 통해 사람의 마음이나 세상의 흐름을 읽고, 심지어 미래를 예측하기도 합니다. 반면, 빅데이터에 대한 우려도 생겨나고 있습니다. 가장 문제가 되는 것이 개인의 사생활 침해 문제입니다. 빅데이터를 안심하고 유용하게 활용하기 위해서는 개인의 사생활 침해와 같은 부작용을 해결할 수 있는 대책을 마련해야 합니다.
 

빅데이터전문가가 하는 일은?

빅데이터전문가는 수많은 데이터 속에 숨어 있는 정보를 찾아내고 분석하여 사람들의 행동 패턴이나 시장 경제 상황 등을 예측하기도 합니다. 실시간으로 생성되는 수많은 데이터를 수집·분석·활용하여 우리 생활에 유용한 가치 있는 정보로 만드는 일을 합니다. 빅데이터분석가들에 의해 생산된 정보들은 다양한 분야에 활용됩니다. 기업에서는 신제품 출시를 앞두고 빅데이터 분석 결과를 활용해 의사 결정을 하고, 생산이나 마케팅 전략을 세우기도 합니다. 이 밖에도 사기 방지, 위험 관리, 보안 등을 위한 자료로도 활용합니다.    
빅데이터전문가는 다른 직업에 비교하여 임금이 높고, 복리 후생이 좋은 편입니다. 빅데이터의 중요성이 날로 커지고 있기 때문에 성장성도 매우 좋고, 새로운 일자리가 많이 만들어지고 있습니다. 근무 환경이 쾌적하고, 육체적 스트레스는 적은 편이나 정신적 스트레스가 많은 편에 속합니다. 빅데이터 분석은 높은 수준의 전문 지식이 요구되는 작업이므로 직업 전문성이 높은 편입니다.

적성과 흥미는?

탐구형
현실형
프로그래밍 실력
데이터 처리 능력
통계학적 지식
분석력
협업 능력
의사소통 능력
리더십
창의력

빅데이터전문가는 통계학, 컴퓨터과학, 머신러닝 등 데이터를 분석하는 데 필요한 기본 지식과 프로그래밍 실력, 서버와 네트워크에 대한 기본 지식을 갖추어야 합니다. 여기저기에 흩어져 있는 데이터를 수집하여 사용자가 필요로 하는 정보로 가공하려면 데이터 처리 능력도 갖추어야 합니다. 빅데이터 업무 중 가장 기본이 되는 데이터과학은 다양한 학문이 융합되어 있기 때문에 빅데이터전문가는 통계학에 대한 지식과 컴퓨터공학에 대한 이해, 비즈니스 역량이 필요합니다. 데이터 분석에 필요한 모형을 만들고 결과를 도출하는 분석력도 갖추어야 하고, 변화하는 기술과 해외 기술 동향, 관련 기사나 관련 논문 등을 습득하려는 노력이 필요합니다. 데이터 분석 과정에서는 여러 전문가와의 협업으로 작업이 진행되는 경우가 많아 의사소통 능력, 협업 능력, 리더십, 문제 해결 능력 등이 요구됩니다.
대용량의 데이터를 활용하기 위해서는 높은 수준의 분석력을 갖추어야 하고, 빅데이터 분석을 통해 새로운 아이디어를 내야 하기 때문에 창의성도 갖추어야 합니다. 데이터를 분석하는 데 오랜 시간이 걸리기도 하므로 인내심과 끈기가 필요합니다. 데이터를 분석하기 위한 수리 능력과 데이터를 분석하는 데 사용하는 솔루션을 가동하기 위한 공학적인 능력도 필요합니다.
빅데이터전문가에 관심이 있다면 컴퓨터 분야에 관심을 갖고, 컴퓨터를 다루는 능력을 키워야 합니다. 다양한 분야에 대한 지식을 쌓고, 신문 기사와 논문 자료 등을 통해 빅데이터와 관련된 최신 정보 및 기술을 습득하는 데 노력을 기울여야 합니다.

진출 방법은?

관련학과
컴퓨터공학과
소프트웨어학과
산업공학과
통계학과
경영학과
수학과
데이터마이닝학과
정보통계처리학과
문헌정보학과
데이터과학과
빅데이터공학과
전산통계학과

빅데이터전문가로 활동하기 위해서는 높은 수준의 지식과 기술이 필요하므로 대학에서 컴퓨터공학, 산업공학, 통계학 등을 전공하는 것이 도움이 됩니다. 최근에 빅데이터 분야가 관심을 끌면서 여러 대학에서 인력 양성을 위해 노력하고 있습니다. 몇몇 대학에서는 석사 및 박사 과정을 개설하거나 새로운 교육 과정을 만들어 빅데이터전문가를 양성하기 위해 노력하고 있습니다. 
빅데이터분석가는 경영, 마케팅 분야에서 지식과 경험을 쌓으면 더 전문적인 능력을 발휘할 수 있습니다. 단순한 빅데이터 분석에 머무르지 않고, 경영학이나 마케팅 분야의 기술을 융합하게 되면 수준 높은 결과물을 얻을 수 있습니다. 경영학 분야의 CRM 관련 자격증이나 데이터베이스, 빅데이터 관련 자격증을 취득하면 도움이 됩니다. 최근에는 인문학을 전공하고 통계학을 부전공한 다음, 대학원에 진학하여 빅데이터 관련 학문을 공부하거나 단기 교육 과정이 개설된 기관에서 교육을 받고 빅데이터전문가로 진출하기도 합니다. 빅데이터 관련 분야를 전공한 다음 금융, 통신, 유통, 제조, 엔터테인먼트 등 빅데이터 활용이 필요한 포탈, 게임, 쇼핑몰 등 인터넷 업체와 공무원, 국가 출연 연구 기관 등으로 진출하거나 빅데이터 관련 회사를 창업할 수 있습니다.

미래 전망은?

빅데이터 관련 기술은 디지털 시대의 발전을 이끌고 있는 핵심 기술입니다. 4차 산업 혁명 시대에는 기술보다 정보 즉, 데이터가 중요합니다. 또한 빅데이터는 서비스, 소프트웨어, 하드웨어 등 관련 산업에 미치는 영향도 매우 큽니다. 우리나라에서도 국가 차원에서 4차 산업 혁명 시대를 이끌어 갈 기술 중 하나로 빅데이터를 선정할 만큼 큰 관심을 가지고 있고, 국내 빅데이터 시장도 매년 20~30%씩 높은 성장률을 보이고 있습니다. 국가와 기업이 생산성 향상을 위해 빅데이터를 적극 활용하면서 국내 시장에서 얻은 경제적 이익이 10조 원 이상이 될 거라는 연구 결과가 발표될 정도로 전망이 밝습니다. 
이러한 업계 동향으로 보아 빅데이터전문가의 고용은 더욱 증가할 것으로 전망됩니다. 또한 경영학, 통계학, 컴퓨터공학 등 다양한 분야와의 기술 융합을 통해 업무 영역이 확장될 가능성이 크므로 산업 전반에 빅데이터전문가들이 배치되어 산업을 발전시키는 데 크게 기여할 것으로 예상됩니다.

어떤 준비를 해야 할까?

관련 교과
수학
과학
정보
 
준비 활동 예시
수학, 과학, 정보 교과 역량 키우기
빅데이터 관련 학과 탐방
인성(봉사상, 선행상, 효행상) 분야 수상
빅데이터 관련 직업 탐방 및 체험 활동
컴퓨터공학, 빅데이터, 4차 산업 혁명 등 다양한 분야 독서
컴퓨터 및 프로그래밍 활용 능력 습득

관련 직업은?

데이터아키텍터
데이터베이스관리자
수학 및 통계 연구원
데이터랭글러
데이터모델러
데이터분석가
데이터샤먼
시장 및 여론조사전문가
데이터웨어하우스 분석가
정보시스템 운영자
경영정보시스템개발자

Tip

데이터랭글러에 대해 알아볼까요?

데이터랭글러는 비전문적인 인터페이스를 사용하여 데이터 소스를 탐색하고, 그 데이터에 숨겨진 의미 있는 데이터를 발견하는 사람이에요. 일반적으로 기술적인 감각으로 무장한 비즈니스 사용자인 데이터랭글러는 빅데이터개발자가 스케치한 것을 산업화할 수 있도록 프로토타이밍 모드에서 작업을 진행해요.

빅데이터 3대 요소는 무엇일까요?

빅데이터의 3대 요소란 크기(Volume), 속도(Velocity), 다양성(Variety)이며, 각 요소는 다음과 같은 특징이 있어요. 

크기(Volume): 일반적으로 수십 테라 혹은 수십 페타 바이트 이상의 데이터를 빅데이터라고 해요. 
속도(Velocity):  오늘날 디지털 데이터는 매우 빠른 속도로 생성되기 때문에 데이터의 생산, 저장, 유통, 수집, 분석이 실시간으로 처리되어야 해요. 수집된 대량의 데이터를 분석하기 위해서는 장기적인 차원에서 접근을 해야 해요. 
다양성(Variety):  다양한 종류의 데이터들이 빅데이터를 구성하는데, 데이터 정형화의 종류는 정형, 반정형, 비정형으로 나뉘어요.

빅데이터의 3대 요소(3V) 가운데 두 가지 이상의 요소만 충족하면 빅데이터라고 해요.