의료데이터 정보화란 환자 중심의 의학연구에 필요한 다양한 임상자료를 수집하고 의사결정 근거를 제시하는 것이다. 본 기고문에서는 의료데이터 정보화의 의미를 제약산업계, 디지털헬스케어 기업, 보험업계 등 산업계 활용에 한정하고자 한다. 필자는 20년 넘게 제약산업계, 의료기관, 스타트업에 종사하면서 다양한 의료데이터를 활용하고 있기 때문이다. 한국은 지난 5년 동안 한국보건의료정보원(KHIS)을 중심으로, 40여 개 국내 의료기관의 진료 자료를 연구용 임상 자료 저장소(Clinical Data Warehouse, 이하 CDW)로 구축하는 데 힘써왔다. 비유하자면, 자료의 운송이 가능한 고속도로(정보 저장) 및 톨게이트(정보 추출)를 구축해 분석 정보 거래의 기반을 마련했다. 현재는 10여 곳의 산업계가 2023년부터 추진한 ’의료데이터 공동 활용 연구 프로젝트’에 참여 중이다.
의료데이터 정보화 현황
‘시작이 반’이라는 말처럼, 첫 사업 시기인 5년은 이렇게 성공리에 마무리됐다. 향후 남은 기간은 바야흐로 ’분석·활용‘의 시대이다. 즉, 고속도로 톨게이트를 출발한 자동차가 일반국도까지 포함한 최적 이동 경로를 안내하고, 원하는 분석 정보를 목적지까지 안전하게 전달하도록 운전수가 있어야 한다. 이것이 바로 ‘소프트인프라’다. 주거시설 하드인프라가 더 의미가 있으려면 교통, 문화시설 등 소프트인프라 함께 존재해야 하듯, 정보 저장·추출의 인프라 외에도 정보화 과정에서 다양한 필터 역할을 하는 소프트인프라가 필요하다. 지방국도, 자동차, 운전수가 이에 대한 비근한 예시이며, 무엇을 의미하는지 각각 설명하고자 한다.
소프트인프라 구성 요소
데이터 연구는 ’아는 만큼 보인다‘ 보다는 ’보는 만큼 안다‘ 이기에 다양한 자료를 볼 수 있는 레지스트리(Registry) 저장소도 필요하다. 범용 데이터베이스(DB)인 CDW가 고속도로라고 한다면, 이를 2차 가공하거나 CDW를 포함한 다수 자료원을 토대로 만든 레지스트리가 바로 지방국도다. 이는 목적에 맞게 다양한 경로로 경유하고 이 과정에서 획득한 더 많은 자료가 집적된 ‘특화 DB’다. 미국, 유럽의 규제기관 대상 제약산업계가 신약허가, 적응증확대 과정에서 활용하는 주 자료원이기도 하다. 비유적으로 만물박사 인공지능(AI) 보다는 특수 목적에 맞는 특화 영역의 고가치 서비스도 필요하기 때문이다.
자동차 역할은 ‘DB 분석 소프트웨어(SW)’가 담당한다. 분석 과정의 투명성과 재현성이 보장돼야 하며, 무작위배정 임상시험(RCT)과 달리 DB 임상연구의 애매함과 모호함을 해결하는 기능이 필요하다. 쇼핑 카탈로그처럼 DB에 담긴 자료들이 어떤 분포와 밀도로 저장되어 있는지 쉽게 보여야 한다. 이것이 ’탐색적 자료분석‘ (Exploratory Data Analysis, 이하 EDA)다. 또한, 편리한 화면 구현 기능 외에도 노코딩 기반 고차원 분석이 지원돼야 한다. 규제기관에 제출하는 제품의 유용성 근거는 주로 비교연구를 통해서 획득한다. 인과관계 추론 연구를 예로 들자면, 공변량도 고려한 비교군 간 ’고차원 변수 매칭 및 비교 분석‘이 그것이다.
정보를 목적지까지 안전하게 전달하는 의료데이터 분석가의 역할도 중요하다. 병원의 전자의무기록(EMR) 데이터를 분석해 산업계를 대상으로 제공하는 인력은 매우 부족하다. 개인정보보호법 개정을 통해 상업적 활용이 가능하게 된 것이 불과 4년 전이기 때문이다. 통신, 금융, 심지어 같은 의료영역인 청구데이터와 비교하더라도 매우 짧은 기간이다. DB 정보화 과정의 마지막 필터인 실사용근거(Real-World Evidence, 이하 RWE) 연구는 ’Research’ 절차와 ‘Evidence’ 문서 측면의 품질관리가 중요하다. 규제기관의 임상시험 실태조사와 유사하다. 지난 20년간 정부-민간이 합동으로 임상시험 종사자를 전문적으로 육성한 것처럼, 기업의 니즈를 이해하고 주제문을 조회·분석 조건으로 변환할 수 있는 융합적인 인력 육성이 시급하다.
실사용근거(RWE) 연구의 중요성
미국, 유럽은 2014년부터 RWE 연구의 변곡점을 맞이했다. 몸 안에서 물질 연구와 별도로 실제 진료 현장의 제품 사용에 대한 유용성 연구가 부각됐다. 미국은 인플레이션 감축법에 따라 메디케이드 제공 의약품 10가지를 선정해 약가인하를 진행할 계획이다. 따라서 의약품의 재평가에 대한 고가치 근거 제시가 필요하다. 첨단의료기기의 수가도 마찬가지다. RWE 변곡점의 영향은 연구대상 측면도 있었다. 희귀, 소아 및 노인 환자 대상 임상시험의 한계가 있었기 때문이다. 노인은 임상시험의 선별조건에서 아예 제외 기준이라서 진료 데이터 외에는 연구용 데이터가 매우 부족한 상황이었다.
초고령사회 대비를 위한 제언
한국은 2025년에 전례 없는 빠른 속도로 초고령사회에 진입한다. 이미 부산광역시 등은 초고령사회다. 의정사태로 인해 필수의료 인력이 줄고, 서울권 병원을 이용하려는 고위험군 환자가 폭증하고 있다. 고령 환자는 평균 6개 질환을 보유하고 있고 최근 1인 가구의 고립된 형태로 인해 고독사 문제도 심각하다. AI 안심전화, 취약계층 대상 요양방문은 궁극적인 해결이 아니다. 고령 환자의 병원진료, 건강검진, 개인생활기록(걸음수 등) 데이터를 통합적으로 활용해 중증 합병증을 예측해 병원에 연결하는 헬스케어가 필요하다. 응급실 이송베드로 실려가 결국 요양병원으로 가는 것보단, 지역사회에서 건강한 삶을 지속하는 것이 중요하다.
정리 및 결론
필자는 정보화 단계에서 일반적으로 보강이 필요한 3가지 요소인 DB, SW, RWE를 열거했다. 고령환자 레지스트리 등 특화 데이터베이스 구축, 중증 합병증 예측 외에도 근감소증 등 신약연구와 특정질환의 유병보험 설계가 가능한 분석 소프트웨어 개발, 그리고 산업계 대상 실사용근거 제공이 가능한 데이터 분석가가 초고령사회가 요구하는 ‘소프트인프라’다. 보건의료기술 그 자체 집중보다는 사회가 시급히 요구하는 헬스케어 서비스를 먼저 정의하고 정부와 민간기업이 전문적으로 함께 해결하려는 시도가 바로 환자가 원하는 공익의 시작일 것이다.
글 / 김동규 메디플렉서스 대표 (kimdklg@mediplexus.net)
김동규 메디플렉서스 대표는 약 20년간 제약기업과 대학병원에서 임상개발 및 연구수행 분야에 종사했다. 국가신약개발재단, 국가임상시험지원재단 및 보건산업진흥원 평가위원으로 활동했으며, 전자의무기록(EMR) 빅데이터를 활용한 가이드북 및 임상개발 전략 사례집을 출간했다. 메디플렉서스는 연구개발 의사결정 정보를 제공하기 위한 병원 의료 빅데이터 기반 임상연구 수행 및 레지스트리 데이터베이스(DB) 구축 경험을 다수 보유하고 있으며, 치료제품 연구개발 지원을 위한 의료 빅데이터 분석 방법 및 솔루션을 개발했다. 이를 바탕으로 의료기관 인프라를 활용한 대학병원-제약산업계 간 R&D 협력 체계를 구축했으며, ALYND 구축 및 SALT PLUS 산학협력 프로그램을 개발했다. 임상시험 혁신 기술 인프라 사업 관련 다수 국책 과제도 수행했다.
댓글 0