[Vol.2] 데이터와 헬스케어의 진화
데이터와 헬스케어의 진화
최호섭 ([email protected])
디지털 칼럼니스트
뻔한 이야기 같지만 현대 기술의 발전은 ‘더 나은 삶’을 추구한다. 기술은 더는 기술 그 자체로 주목받는 것이 아니라 세상의 문제를 해결하는 데에서 의미를 찾는 것이 요즘의 흐름이다. 더구나 모든 산업 환경에서 인공지능과 빅데이터, 클라우드 등 IT 기술에 뿌리를 둔 디지털 트랜스포메이션이 일어나면서 이전과 다른 데이터 기반의 혁신이 이어지고 있다.
의료와 헬스케어는 데이터가 가장 활발히 활용되는 분야 중 하나다. 말썽을 일으키고 있는 바이러스를 비롯해 세균, 질병은 모두 진행 과정에서 의미 있는 데이터를 만들어낸다. 그 데이터에 귀를 기울이는 것이 헬스케어의 출발이자 궁극적인 목표이기도 하다.
전염병의 사회적 극복 방법, ‘데이터’
코로나19를 비롯한 전염병의 확산은 질병 외에도 사회적으로 많은 숙제를 던진다. 사회는 당장 치료법뿐 아니라 전염병의 확산을 막을 수 있는 고민과 비슷한 상황에 대한 대처를 학습하게 된다. 이번 코로나19는 무엇보다 정보의 역할이 눈에 띈다.
전염병의 확산에는 으레 뒤숭숭한 소문들이 돌게 되고, 이를 통제하기 위한 여러 가지 방법들이 제시되는데 가장 효과적인 방법은 정확하고 투명한 정보의 공개다. 이번 코로나19에 대해 정부는 이례적으로 확진자들의 동선을 비롯한 위치 정보를 제공했다. 공공데이터를 통해 전염 경로를 억제하려는 시도와 함께 확인되지 않은 소문을 통한 불안감을 해소하려는 목적이다.
민간에서는 이 데이터에 의미를 더했다. 시간 순서에 따라 단순한 텍스트로 공개되던 이 정보는 대학생들이 데이터와 각종 API를 이용해 개발한 ‘코로나맵’을 통해 시각화 되면서 더 즉각적으로 전달되기 시작했다. 코로나맵은 여전히 확진자들이 다녀간 동선을 공개하고 확진자와 접촉할 가능성을 보여주면서 역할을 하고 있다. 확진자가 늘어나고 있지만 잠복기를 반영한 위치 기반 시각 데이터는 지속해서 동선 정보를 제공하고 있다.
여러 가지 변수가 더해지긴 했지만 활발한 정보 공개는 불안을 키울 수 있고, 개개인의 신상정보가 공개되거나 사업장에 발길이 끊어지는 등 우려가 있긴 했지만, 개개인이 초기에 질병을 관리하고 접촉을 줄일 수 있는 효과적인 역할을 했다. 코로나맵은 데이터라고 해서 꼭 거창한 시작이 아니어도 위기 대응에 활용할 수 있다는 것을 확인하는 계기가 됐다.
인공지능을 통한 전염병 예측
사실 전염병의 전파 경로에 관한 연구는 꽤 오랫동안 이어져 왔다. 코로나맵의 경우 발병 직후의 확산 경로에 대한 데이터가 담긴다면 캐나다의 블루닷은 코로나19의 발병 초기에 세계적인 확산 가능성을 경고하면서 유명세를 치르고 있다.
전염병의 확산을 분석하는 방법은 여러 가지가 있는데 블루닷은 다양한 전문 데이터와 사회적 반응을 분석해 전염병 확산을 예측하는 알고리즘으로 주목을 받고 있다. 그동안은 인터넷 검색, 소셜미디어 언급 빈도를 바탕으로 사람들의 관심사가 늘어나는 것을 전염병의 확산으로 파악하는 경우가 많았다. 블루닷은 머신러닝을 이용해 전염병 확산을 예측한다. 인터넷을 통해 각종 질병에 대한 정보를 수집하고, 전문가들의 논문, 학회 포럼, 보고서 등을 분석한다. 이 외에도 사람들이 예민하게 반응하는 부분들을 데이터화하고 그 변화를 예민하게 알아채고 있다.
이번 코로나19의 분위기가 심상치 않다는 것을 파악하고, 우리나라를 비롯해 일본과 홍콩, 대만 등으로 번질 수 있다는 실마리는 바로 비행기의 티켓팅 정보에서 시작됐다. 전염병이 퍼지기 시작하면 해당 지역으로의 여행과 비즈니스에 조심스러워지게 되고, 해당 도시와 연결된 다른 지역, 국가로 번져 나갈 것이라는 예측에서 시작됐다.
미디어의 보도도 블루닷이 주목한 정보다. 소셜미디어의 정보보다 정제되어 있고 특정 사건, 그러니까 확진자 전파, 감염 과정, 사망자 등에 대한 정보가 비정상적으로 늘어나는 것은 충분히 심각성을 짚어볼 수 있는 지표가 된다.
블루닷은 2003년, 사스(SARS)의 확산을 경험한 감염 내과 전문의인 캄란 칸이 전염병 확산 경로를 연구하기 시작하면서 시작됐다. 2009년에는 우리나라를 비롯해 전 세계를 들썩이게 했던 신종 인플루엔자의 확산을 분석, 예측하면서 서서히 자리를 잡았다. 캄란 칸은 2013년 이 프로젝트를 비즈니스로 만들고 본격적으로 감염병 예측 솔루션을 개발했다. 이후에도 지카 바이러스 등 몇 년을 주기로 세계를 공포에 몰아넣는 전염병을 토대로 실험해 왔고, 2019년 12월 자체 리포트를 통해 중국 우한 지역의 코로나 바이러스가 인접 도시 및 국가들로 번져 나갈 수 있다는 경고를 했다. 심각성을 경고하는 데에 조심스러운 WHO에 비해 민간 기업의 경우 더 과감하게 예측할 수 있다는 점도 있지만 그 경고의 근거가 되는 데이터와 머신러닝 기반 분석 알고리즘은 충분히 주목할 만하다.
데이터로 질병 읽기, ‘머신러닝의 역할’
머신러닝은 전염병의 확산뿐 아니라 직접 질병 치료, 신약 개발, 건강 관리 등에도 활발하게 쓰이고 있다. 머신러닝의 가장 효과적인 역할 중 하나가 데이터의 변화를 민감하게 파악한다는 것이다. 구글은 내부적으로 텐서플로를 바탕으로 질병의 초기 진단을 오랫동안 고민해 오고 있다.
그중 가장 확실한 효과를 내고, 대중적으로 인지도도 높은 것이 바로 이미지 분석을 통한 진단이다. 방사선 촬영, MRI 등 병원에서 가장 쉽게 이뤄지는 검사 결과를 분석하는 것이다. 세계적으로 의사의 수는 늘 부족하므로 진료 과정에서 환자 한 명에게 집중할 수 있는 시간은 그리 길지 않다. 구글은 영상 검사 결과 이미지를 머신러닝으로 분석해 아주 미세한 진행을 찾아내는 시도를 고민했다.
구글이 가장 먼저 시도했던 것은 당뇨성 망막 변증 진단이었다. 망막을 찍은 간단한 사진 한 장이면 당뇨 합병증을 진단할 수 있고, 약을 통해 충분히 관리할 수 있는 질병이라는 점 때문이다. 하지만 뜻밖에 초기 진단이 쉽지 않아 시력을 잃는 환자들이 많다는 것도 이 병의 특징이다. 구글은 텐서플로로 당뇨성 망막 변증의 패턴을 읽어냈고, 2016년 논문을 통해 훈련받은 일반인들 수준의 진단을 내릴 수 있다고 밝혔고, 현재는 전문의 수준으로 진단을 내릴 수 있을 만큼 정확도가 높아지면서 인도와 태국 등 동남아시아 국가들의 의료 현장에서 실제로 활용되고 있다.
구글은 이를 바탕으로 폐암과 유방암의 림프절 전이 진단에 이 머신러닝 기술을 확대하고 있다. 데이터만 충분히 학습되면 정확도는 꾸준히 높아질 수 있고, 의사들의 전문성을 더해 빠른 진단과 조기 치료를 시작할 수 있게 될 것으로 보인다.
DNA 분석에도 인공지능 기술이 활용된다. 악성 종양의 DNA가 어떻게 변이되는지를 세밀하게 분석할 수 있다면 암을 억제하고, 치료하는 데에 유리하기 때문에 DNA 분석은 의학계의 오랜 숙제다. 하지만 복잡한 DNA 분석을 위해 막대한 컴퓨팅 파워와 효과적인 데이터 분석 알고리즘이 필요하다. 막대한 데이터를 분석할 수 있는 클라우드와 머신러닝은 이를 풀어낼 수 있는 효과적인 방법이다. ‘퍼스널 게놈 다이고노스틱스(Personal Genome Diagnostics:PGDx)’는 종양의 변이를 추적하고 진단할 수 있는 도구를 개발했다고 밝힌 바 있다. 이를 통해 암세포를 정확히 파악해 치료 효과를 높인다는 것이다.
구글의 조기 진단법과 마찬가지로 질병의 진행도나 세포의 움직임에는 분명 복잡한 규칙이 있고, 그 습관을 이해할 수 있다면 치료 효과를 높일 수 있다. 이를 읽어내는 것은 결국 간단한 공식이 아니라 아주 예민한 변화와 복잡한 패턴을 판단할 수 있는 머신러닝 기술의 역할이다.
치료, 그리고 일상의 건강으로 확장
직접적인 치료제 개발에도 머신러닝 기술이 활용된다. 약의 효과를 높이기 위해 여러 가지 약물을 섞는 칵테일 치료는 요즘 지속해서 연구되는 분야다. 약물의 조합에 따라서 더 큰 효과를 낼 수 있고, 특정 약품에 대한 내성을 줄이는 효과도 있다. 하지만 많은 실험이 필요하고, 예민한 임상 실험 반응의 분석이 필요하다.
미국 미시간대학의 연구팀이 개발한 결핵약 최적화 시스템 ‘인디고’는 환자의 상황에 따라 적절한 약물 조합으로 결핵 치료의 효과를 높일 방법을 찾아냈다. 결핵약에 몇 가지 약물을 조합하면 효과가 커질 수 있는데, 머신러닝을 통해 약물 조합의 결과를 예측했고, 이를 통해 결핵약의 효과를 높이고, 복용 기간을 줄일 수 있다.
결핵약은 독성이 높은데다가 보통 1년 이상 꾸준히 먹어야 하고, 중간에 복용을 게을리하면 내성이 생겨서 치료가 어려워진다. 이런 특성 때문에 세계적으로 결핵약은 늘 부족을 겪고 있다. 인디고의 약 조합은 효과를 높여서 결과적으로 더 적은 결핵약으로 더 나은 치료 결과를 얻어낼 수 있었다.
건강 데이터는 이제 ‘일상’의 영역으로 들어오고 있다. 아파야 병원을 가는 것이 이제까지의 건강 관리였다면 앞으로는 일상의 모든 데이터를 실시간으로 파악하고, 그 작은 정보들을 모아 미리 질병을 예측하고 적절히 대응하는 것으로 이동하고 있다. 이는 일상의 병원 진료나 입원 등의 데이터뿐 아니라 혈압, 혈당, 운동량, 식습관 등 아주 작은 데이터와도 연결될 수 있다.
애플이 애플워치와 건강관리 서비스를 통해 만들어내려는 목표도 바로 이 일상의 건강관리에 있다. 애플워치는 5세대에 접어들면서 심장박동수를 늘 체크하고 심전도 검사를 통해 부정맥을 비롯한 심장 건강을 상시 관리하고, 넘어지거나 굴러 떨어지는 등 낙상 사고를 인지해 신고해주는 등 일상의 건강을 체크하는 영역을 늘려가고 있다.
애플은 이 애플워치와 함께 ‘건강’ 서비스를 함께 운영하고 있는데, 애플워치를 통한 건강 기록이 모두 이 앱으로 모인다. 또한, 애플은 이를 플랫폼화하고, 여러 가지 서드파티 건강관리 도구의 측정 결과와 병원에서 이뤄지는 진료 기록, 식습관 등을 통합적으로 관리하는 방향으로 서서히 발전시켜가고 있다. 이러한 데이터는 주치의를 비롯해 존스 홉킨스 대학병원 등 대형 연구기관과 공유해서 효과적인 건강관리를 만들어내는 데 쓰인다.
질병, 그리고 통증은 우리 몸이 보내는 신호라고 한다. 우리 몸은 세상에서 가장 예민하고 복잡한 센서다. 그 센서가 만들어내는 데이터에 귀 기울이는 것이 바로 치료다. 더 많은 데이터를 수집, 보관하고, 분석할 수 있는 기술의 발전을 통해 더 아프기 전에 빨리 대처하는 진정한 의미의 헬스케어가 열리고 있다.