한국의 대표산업들 중 하나인 정보통신산업의 핵심 소재로 ‘빅데이터’가 자리잡았다. ‘빅데이터’는 인터넷상에서 이루어지는 모든 활동으로부터 수집되어 가공된 데이터들을 의미한다. 이것은 인터넷에서의 정보 과잉을 해소하기 위해 생겨났다. 검색 엔진에서의 검색 기록, SNS에서의 모든 활동 기록, 영상 플랫폼에서의 영상 재생 기록 등이 모두 ‘빅데이터’의 일부로 기록된다.
빅데이터와 기존의 데이터의 차이점은 크기, 속도, 다양성으로 분류된다. 데이터는 비트 단위를 기본으로 하는 반면, 빅데이터는 말 그대로 수십 테라 바이트 이상의 방대한 양의 데이터를 의미한다. 또한 빅데이터는 관련 분야에 쓸모가 있을 데이터들을 솎아낸 것들이므로 항상 수집, 분석, 저장, 유통의 네 박자가 빠르게 맞아떨어져야 한다. 만약 이 처리 속도가 데이터 발생 속도보다 느리다면 그 결과물은 존재의 의미를 잃는다. 기존 데이터와 빅데이터의 가장 큰 차이점은 다양성에 있다. 기존 데이터가 일정하게 분류된 엑셀과 같이 통계에 직접 사용할 수 있는 정형 데이터들만 취급하지만, 빅데이터는 인터넷 뉴스의 댓글, 페이스북의 좋아요, 심지어는 동영상과 사진 등의 비정형 데이터들도 가공하여 정보화한다.
빅데이터가 주목받는 이유는 빅데이터를 다양한 분야를 예측하는데 활용할 수 있기 때문이다. 발생하는 데이터들의 형식이 뚜렷하지 않고 원천도 다양하기 때문에 각 분야에 알맞게 최적화 할 수 있다. 빅데이터는 그 가치를 인정받아 현재 다양한 대학에서 빅데이터를 전문으로 다루는 학과를 신설하고 있다.
빅데이터는 다방면에서 활용되고 있다. 의학 분야에서는 구글의 ‘플루 트렌드’가 빅데이터 활용의 성공 사례로 꼽힌다. 사람들이 감기에 걸렸을 때 관련 정보를 검색하는 것을 기록하여 그 빈도가 높은 지역에 감기바이러스가 퍼질 것을 예측한다. 사회 분야로는 중국의 “유령도시”를 색출해내는 시스템을 고안한 것이 세계적인 찬사를 받았다. “유령도시”는 수요를 고려하지 않은 마구잡이식 건설로 생긴 빈집들이 늘어 도시 슬럼화가 급속도로 진행되고 있는 도시를 가리키는 말이다. 베이징 대학과 중국의 포털 업체 바이두가 빅데이터를 활용해서 만들었다.
빅데이터는 산업은 그 경계가 뚜렷하지 않고 신생 분야이기 때문에 아직 완전히 구축되지는 않았지만, 그 활용 분야가 다양하고 그 효용이 뚜렷하기 때문에 많은 일자리와 부가 가치를 창출할 것으로 보인다. 빅데이터 산업은성장 기록 축적량이 적은 탓에 예측 기관에 따라 전망에 큰 차이를 보였다. 인터넷 데이터 센터(IDC, Internet Data Center)는 빅데이터 기술 및 서비스 시장 규모를 2015년 약 183억 달러, 연평균 32.7%의 성장치를 예측한 반면, 리서치 회사 위키본(Wikibon)은 빅데이터 시장 규모를 2015년 약 384억 달러, 연평균 31.7%의 성장치를 예측하였다.
16기 박지헌 기자
사진출처: 네이버 이미지