"빅데이터 활용가치 부상…분석 한계 극복관건"
- 김정주
- 2014-03-21 12:24:51
-
가
- 가
- 가
- 가
- 가
- 가
- 보사연 오미애 부연구위원, 거시적 통찰·사회적 합의 제언
- PR
- 약국경영 스트레스 팡팡!! 약사님, 매월 쏟아지는 1000만원 상품에 도전하세요!
- 팜스타클럽

특히 보건복지분야의 경우 개인 건강과 밀접한 정보를 효과적으로 사용한다는 점에서 새롭게 창출할 수 있는 가치 사이에서 상충관계를 찾아 해결하는 것이 중요하다는 의미다.
보건사회연구원 사회통계연구실 오미애 부연구위원은 최근 '보건·복지 이슈&포커스'에서 '정부3.0과 빅데이터'를 주제로 이 분야 현황과 과제를 짚었다.
정부3.0과 함께 대두된 빅데이터는 자료의 양(Volume)을 바탕으로 다양한 정보의 결합(Variety)이 가능하고, 자료축적 속도(Velocity)가 빨라 새로운 가치(Value) 창출에 부합한다.
보건의료분야를 살펴보면 단일 건강보험제도로 축적된 방대한 양의 빅데이터 융합·활용을 기대케 한다.
실제로 심사평가원의 '병원·약국 정보검색 서비스'는 병원별·질환별 진료비와 입원일수 등의 정보를 개인 스마트폰 애플리케이션과 인터넷을 통해 확인 가능하게 개발한 것으로, 안전행정부의 정부3.0 우수사례에 꼽히기도 했다.
광주광역시 광산구의 경우 지리정보시스템(GIS)를 결합해 수완보건지소 지역의 만성·재활 등 기타 진료 이용자 평균 연령을 추출해 보건소 이용률을 지역별로 파악, 자치에 활용하고 있다.
활용목적에 따라 높은 가치를 창출할 수 있는 빅데이터지만, 활용하는 데 한계점도 있다.
먼저 '과적합(overfiting)' 문제로, 미래 예측력이 오히려 떨어질 수 있다는 우려다. 방대한 양을 다루는 만큼 자료를 세분화시켜 세밀한 정책적 판단을 가능케 하지만, 지나치게 정교하게 분석할 경우 부작용이 나타날 수도 있다는 것이다.
오 부연구위원은 "빅데이터를 분석할 경우, 현재 자료가 미래를 가장 잘 설명할 수 있다는 통계학의 기본가정이 성립되는 지 살펴봐야 한다"며 "생산·축적되는 모집단 자체가 변화될 수 있다는 사실에 유의해야 한다"고 밝혔다.
'차원의 저주(curse of dimensionality)' 문제도 간과할 수 없는데, 분석의 정확도를 일정부분 유지하기 위해 변수의 수를 증가시킬 때마다 필요한 데이터의 수가 기하급수적으로 늘어나는 원리로, 다양한 정보 결합을 기반으로 하는 빅데이터 활용에서 나타날 필연적인 문제다.
변수의 개수가 무수히 많아지면 아무리 빅데이터라고 해도 감당하기 어려운 수준일 수 있기 때문에 여러 통계적 기법들을 고려해야 한다는 것이 오 부연구위원의 제언이다.
한계점 중에서도 무엇보다 가장 지적되고 있는 것은 단연 개인정보보호와 법적 문제다.
최근 사회적 이슈가 되고 있는 주요 신용카드사의 대량 개인정보 유출 사건은 빅데이터 구축과 활용을 제약하는 한계로 작용할 수 있는 대표적 사례다.
오 부연구위원은 "개인정보가 포함된 데이터에 충분한 수준의 익명화를 거쳐 데이터를 분석한다면, 이에 대한 한계와 빅데이터 창출 가치 사이에 상충관계는 어느 정도 해결이 가능할 것"이라고 기대했다.
- 익명 댓글
- 실명 댓글
- 댓글 0
- 최신순
- 찬성순
- 반대순
오늘의 TOP 10
- 1알부민 과대광고 홈쇼핑 단속 '제로'…"식약처는 적극 나서야"
- 2'창고형 약국 약값체크' 앱까지 나왔다…약사들 아연실색
- 3'1조 돌파' 한미, 처방시장 선두 질주...대웅바이오 껑충
- 4상한가 3번·두 자릿수 상승 6번…현대약품의 '탈모' 랠리
- 5부산 창고형약국, 서울 진출?...700평 규모 개설 준비
- 6'마운자로', 당뇨병 급여 위한 약가협상 돌입 예고
- 75년 엔트레스토 분쟁 종지부...제네릭 승소 이끈 3대 쟁점
- 8"대사질환 전반 정복"…GLP-1의 확장성은 현재진행형
- 9비보존제약, 유증 조달액 30%↓...CB 상환·배상금 부담↑
- 10"잠자는 약사 권리 깨우고 싶어"…184건 민원에 담긴 의미





