빅데이터(Big Data)란 디지털 환경에서 생성되는 모든 데이터를 의미한다. 수치 데이터뿐만 아니라 문자와 영상 데이터 등 대규모 데이터를 포함하는데 생성 주기가 짧은 반면, 규모는 방대하다는 특성이 있다.

과거에 비해 데이터의 양이 폭증했고, 종류도 다양해져서 위치정보와 SNS를 통해 사람들의 행동은 물론 생각과 의견까지 분석하고 예측할 수 있다. 예를 들어 이런 일도 있었다고 한다.

미국 어느 가정에 10대인 딸 앞으로 배달된 임산부용 물품 홍보책자를 본 아버지는 그만 망연자실하고 만다. 화가 나서 그 회사에 항의를 하던 중 딸이 즐겨 검색한 인터넷 사이트 흔적을 통해 검색자가 임산부라고 판단했다는 설명을 듣고 혹시나 해서 확인했는데 임신사실이 밝혀졌다.

본인도 몰랐던 자기 상태를 빅데이터를 이용한 마케팅팀이 알려준 셈이 된 것이다. PC와 인터넷, 스마트 폰 등 모바일 기기 이용이 보편화되면서 사람들이 도처에 남긴 발자국, 즉 데이터들이 매일 엄청나게 증가하고 있다.

쇼핑의 경우 과거에는 상점에서 물건을 구매했을 때만 데이터가 기록된 반면 인터넷쇼핑몰의 경우엔 구매를 하지 않아도 방문자의 기록이 데이터로 자동 저장된다. 어떤 상품에 관심이 있는지, 얼마 동안 쇼핑몰에 머물렀는지가 고스란히 자료로 남는 것이다.

현대인들은 은행, 증권 같은 금융거래, 학습, 자료검색과 이메일 등 많은 시간을 PC와 인터넷에 할애하면서 스스로 데이터를 제공하고 있다. 빅데이터는 또한, 모든 분야에서 사람들의 일거수일투족을 모조리 담아내고 있다.

도시 곳곳, 건물 여기 저기 설치된 CCTV 또한 엄청난 데이터의 저장고라고 할 수 있다. 일상생활에서 벌어지고 있는 행동들을 빠짐없이 데이터로 재생산하고 있는 셈이다.

공공 분야에서도 데이터를 양산 중이다. 다양한 사회 조사, 국세자료, 의료보험, 연금 등의 분야에서 데이터가 생산되고 있다. 이렇게 엄청난 데이터가 생성되고 그 데이터를 분석한 전략들이 모든 분야에 적용되고 있는데 과연 우리나라 환경정책을 수립하는데는 얼마나 적절히 이용되고 있는지 의문이다.

빅데이터까지 가기도 전에 정부가 기존에 추진해 온 각종 환경정보, 통계자료들이 제대로 구축이나 되고 있는지도 파악이 되지 않는 상황이다.

지역별 토양오염 현황, 구제역 매몰지 인근 수질현황 등 거의 대부분 환경관련 자료들은 ‘보안’, ‘개인 정보’ 등의 이유를 들어 외부공개를 금지하고 있다.

국민의 알 권리를 충족시키고, 삶의 질을 제고하기 위해서는 관련 데이터를 과감히 투명하게 공개하는 일부터 서둘러야 한다. 환경정책의 공신력을 높이기 위해서도 정책결정에 사용된 데이터를 밝힐 필요가 있다.

‘맞다면 맞는 줄 알라’식의 독선적 행보에는 아군이 생길 여지가 없다. 조금 부족해도, 갈등을 겪어도 함께 시선을 맞추며 방향과 속도를 조정하는 노력이 필요하다.

빅데이터 전문가들은 가장 중요한 것이 사회적 공감대를 형성하는 것이라고 강조한다. 공공의 이익을 위해 수집된 막대한 환경데이터들은 공유돼야 한다.
저작권자 © 환경일보 무단전재 및 재배포 금지