죽은 데이터, 참조 표준, RTE 짧은 글, 짧은 생각

아직도 상흔이 가시지 않은 우면산 산사태 사고를 바라보는 시각은 저 마다 다르지만 제가 하고 있는 일의 입장에서 보면 또 이렇게 잊혀지는구나 하는 아쉬운 대목이 있습니다. 처음엔 호들갑 떨 듯 모든 언론이 떠들어 댔지만 금방 사라져 버린 부분이 있습니다. 바로 데이터의 정확성 이라는 부분입니다. 처음 산사태 주의보를 산림청이 했는데 해당구청인 서초구청이 안일하게 대처했다고 상호 했다, 안 받았다를 두고 공방을 펼쳤습니다. 결과는 산림청이 사전에 정보를 주었는데 받은 구청 직원은 퇴직 상태였다는 어처구니 없는 상황이었습니다. 그리고는 또 하나의 일과성 해프닝처럼 이 중요한 일이 조용히 잊혀졌습니다.

각종 마케팅 커뮤니케이션 데이터를 얻어 분석하는 일을 주로 하는 저는 이 일을 보며 한심하다는 생각이 들었습니다. 죽은 데이터를 가지고 있었다는 굉장히 중요한 일을 간과하고 그에 대한 대책이나 방법론을 제시하는 언론이나 전문가를 보지 못했습니다. 데이터는 생명력을 가지고 있어야 합니다. 어제의 틀린 데이터 하나가 이렇게 많은 인명과 재산 피해를 주었는데 그에 대한 언급은 그 어디에도 없습니다.


굳이 기업처럼 데이터베이스 마케팅까지는 하지 않더라도 업무에 대한 중요 데이터들은 수시로 점검을 하고 늘 대비를 하고 있어야 합니다. 군대처럼 5분 대기는 아니더라도 항상 체크하고 정확성을 점검해야 합니다. 그래야 이번처럼 이미 죽은 데이터를 가지고 위험을 예보하고 대비하는 어리석음이 없게 됩니다. 지금이라도 문제점을 체크해서 다시는 이 같은 바보 같은 반복을 하지 말아야 합니다.


혹시 “참조 표준(reference standards)”이라는 용어를 아십니까? 참조표준은 신뢰할 수 있는 수치 데이터를 말하는데 데이터와 정보의 정확도와 신뢰도를 공인하기 위한 자료로 사용되는 것을 말합니다. 우리나라도 KRISS(한국표준과학연구원) 산하에 지난 2006년도 국가 참조표준센터를 설립하고 국가적으로 필요한 참조표준을 제정·보급하기 위해 총 17개의 참조표준 데이터센터를 지정하고 이를 중심으로 참조표준을 생산·보급하고 있습니다. 참조표준은 신뢰성 높은 각종 과학 기술 물성 값, 실험측정 데이터, 수치 및 상수 데이터 등으로 구성되는데 데이터와 정보의 정확도와 신뢰도를 분석 심사하여 참조 표준으로 설정하게 됩니다.


참조표준의 대표적인 사례가 사람의 생명을 다루는 보건의료분야인데 그 기준이 인종과 환경에 따라 변하는 살아있는 데이터라는 속성을 지니고 있습니다. 생활환경이 바뀌면 고혈압 판정 기준, 혈당 위험수준 판단기준 등도 바뀔 수밖에 없고 대상에 따라 성별·연령별로도 서로 다른 데이터를 적용해 데이터의 신뢰성을 높이고 있습니다.


또 기업에는 RTE(Real-Time Enterprise)라는 것이 있습니다. 기업의 주요 경영 데이터들을 통합 관리하는 실시간 기업의 기업경영 시스템으로 기업 전 부문에서 얻어진 정보를 하나로 통합해 빠른 의사결정을 통해 경쟁력을 높이려는 것입니다, 기업 경쟁이 글로벌화되고 기술의 급속 발전, 경쟁기업의 동향, 고객의 반응 등 급격하게 변화하는 현실에 대응하기 위함입니다..


참조 표준이나 RTE나 모두 데이터가 기초가 된다는 공통점이 있습니다. 시스템이라는 것은 바른 데이터가 바른 정보를 제공하는 특성을 가지고 있습니다. 그래서 GIGO(Garbage In, Garbage Out)라는 말이 있습니다. 엉터리 데이터가 들어가면 쓰레기가 나온다는 것입니다.이번 산림청, 서초구청간의 공방이 바로 GIGO의 대표적 전형입니다. 이 죽은 데이터는 산림청이나 서초구청 모두에게 책임이 있습니다. 담당자가 바뀌었으면 바뀐 데이터를 입력해 줘야 하고 반대로 활용기관도 수시로 데이터의 정확성을 체크해 오류가 있는지 점검했어야 합니다. 일반 시민들도 전산으로만 어디든지 이사가면 간편하게 신고가 가능하고 그것은 즉시 살아있는 데이터가 됩니다. 하물며 공무를 하는 공무원들의 데이터는 더욱 쉽고 편리하게 관리할 수 있어야 합니다.


데이터 베이스의 출발은 당연히 각종 데이터를 수집하는 데이터 개더링(gathering)부터 입니다. 그 다음이 데이터 마이닝(mining)입니다. 개더링한 데이터들을 정제하는 과정입니다. 쓸모있는 데이터만 취하고 나머지는 버려야 합니다. 이렇게 마이닝된 데이터는 다시 수시로 체크를 해야 합니다. 각종 정보를 정기적으로 주고 받으며 기업의 RTE처럼 언제든 활용이 가능하도록 살아있도록 해야 합니다.


데이터 베이스 관리의 가장 중요한 목표는 살아있음 입니다.급변하는 환경 속에서 언제든지 활용해야 하고, 적기에 활용이 가능하기 위해서는 살아 숨쉬는 데이터가 되게 해야 합니다. 그래야 이번 우면산 산사태 사고 같은 전철을 밟지 않게 됩니다. 늘 그렇듯 큰 일은 아주 사소한 작은 것에서부터 기인합니다. 호미로 막을 수 있도록 도와주는 것이 바로 데이터의 살아있음 입니다. 이번에도 사전에 제대로 정보가 전달되고 빠르게 대처 했더라면 제산 피해는 몰라도 인명까지 잃는 최악의 상황은 면했을 수도 있습니다.


그런데 이 중요한 데이터의 살아있음을 아직도 모르고 지나가고 있습니다. 이번 기회에 비상연락망 등 공무원들의 각종 데이터들을 총체적으로 점검해야 합니다. 그래서 죽은 데이터는 살려내야 합니다. 그리고 항상 살아 있는 데이터가 되기 위해 수시로 점검하고 수정해야 합니다.


이번에도 예외없이 SNS가 여느 언론사보다도 빠르고 생생하게 수해 현장의 정보들을 올려주었습니다. 이 정보는 개인들의 살아있는 정확한 데이터를 통해 119보다도 빠르게 현장의 위험을 해결했고 현장의 혼란을 사전에 알려줘 우회하는 등 확실한 정보의 활용이 되었습니다.


굳이 참조표준이나 기업의 RTE정도가 아니어도 됩니다. 적어도 데이터 정도는 늘 살아 숨쉬게 만들자는 말입니다. 위기관리시스템은 평소에는 무용지물 이다가도 단 한번의 위험을 제대로 대처하자는 데 그 목적이 있습니다. 마치 사람들의 생명이나 상해 보험처럼 말입니다. 살아있는 데이터만이 그 단 한번의 위기를 대비하는 작은 단초입니다. 그리고 이 살아있는 데이터만이 정부와 국민 그리고 정부와 정부 상호간의 충성도 높은 관계를 만들게 됩니다.


우리 말에 “인력으로 안되는 것이 있다”는 말이 있습니다. 이번 사태에 살아있는 데이터였더라면 주민들이나 국민들이 이렇게 생각했을 겁니다. 그리고 충성스러운 상호 관계로 비난의 화살을 공무원에게 돌리지 않았을 겁니다. 인력으로 안되는 것이었기 때문입니다.


덧글

댓글 입력 영역