[Vol.6] 4차 산업혁명과 포스트 코로나, 신원인증 시장 주목

 In KISA Report

4차 산업혁명과 포스트 코로나, 신원인증 시장 주목

유성민([email protected])

IT 칼럼니스트

서강대학교 정보통신대학원 대우교수

4차 산업혁명과 포스트 코로나

 

현재 세계는 2가지 변화에 직면했다. 하나는 4차 산업혁명이고, 다른 하나는 포스트 코로나이다. 4차 산업혁명은 디지털 혁명으로 정의할 수 있다. 혹은 디지털 전환(Digital Transformation)으로도 볼 수 있다.

 

사물인터넷(IoT)은 초연결을 통해 디지털 세계에 기반이 되는 데이터 인프라를 구축하는데, 5세대 통신망(5G)은 무선에서도 이러한 인프라를 더욱더 가속화해 데이터 인프라를 더욱더 빠르게 확산시킨다. 인공지능(AI), 클라우드, 블록체인, 엣지컴퓨팅 등은 이러한 디지털 인프라를 기반으로 플랫폼을 구성함으로써, 디지털 세계의 가치를 제공한다. 그리고 이러한 가치는 가상물리시스템(CPS, Cyber-Physical System)의 형태로 제공한다. 아래 그림은 이러한 구성을 개념도로 표현한 것이다.

 

코로나19는 의료뿐만 아니라 경제, 사회 등 분야에서도 주목하고 있다. 여러 전문가가 코로나19가 단순 전염병을 넘어 세계를 바꿀 전환점으로 바라보고 있기 때문이다. 참고로 코로나19 발생 여부 기준의 전환점을 강조하기 위해 “포스트 코로나”라는 용어가 사용되고 있다. 참고로 포스트 코로나는 직역하면, “코로나19 이후”라는 뜻을 가진다.

 

코로나19가 세계에 커다란 영향을 미칠 것으로 분석됨에 따라, 코로나19는 흑사병에 비유되기도 한다(1). 흑사병은 세계 역사 교과서에 다룰 만큼 매우 중요한 사건이다. 특히, 중세유럽에 중심을 둬 흑사병을 다루고 있다. 중국과 아프리카에서 더 큰 피해를 입었음에도 불구하고 말이다. 중세유럽은 흑사병으로 전 세계 인구의 3분의 1에 해당하는 2,500만 명이 사망했다. 중국의 경우, 3,000만 명이 넘는 인구가 사망했다.

 

그런데도 흑사병 발생이 중세유럽에 초점을 두고 있는 이유가 무엇일까? 세계 역사를 바꿀 만큼의 사회 및 경제 전환을 가져왔기 때문이다. 심지어 문화도 바꿨다. 캐서린 에쉔버그(Katherine Ashenburg)는 흑사병이 목욕 문화를 바꿨다고 주장한다(2). 당시 중세유럽인은 따뜻한 물에 몸을 담그면 역병이 쉽게 침투당한다는 허위 사실을 믿으면서 목욕을 배척했다. 이는 사람의 몸에서 악취를 풍기게 했는데, 중세 유럽인은 이를 없애고자 향수를 많이 사용했다. 덕분에 향수 산업이 발전했다. 또 다른 문화 변화로는 “신”에서 “인간”의 중심으로 변한 것이다. 흑사병은 일반인을 비롯해 성직자의 목숨을 앗아가면서, 교회에 관한 의존도를 떨어뜨렸다. 이는 르네상스 탄생의 원동력이 된다.

 

이에 더해, 흑사병은 1차 산업혁명의 원동력이 되기도 했다. 미국 MIT 교수 ‘피터 테민(Peter Temin)’은 흑사병이 1차 산업혁명을 불렀다고 주장하는데, 흑사병으로 인한 농노 인구의 감소는 임금 향상으로 가져왔는데, 이는 영주가 비용 감소를 위해 대체재를 찾게 만드는 원동력이 됐다. 그리고 이는 기계를 등장시키게 했다. 그뿐만 아니라, 1차 산업혁명 탄생의 배경이 되기도 했다. 노르웨이 사학자 ‘요르겐 베네딕토우(Ole Jørgen Benedictow)’는 “농노의 수입이 많아지면서 물품 구매와 같은 소비가 촉진해 자본주의를 가져왔다”고 주장한다.

 

이처럼 흑사병은 전 세계의 흐름을 바꾼 “1차 산업혁명”과 “자본주의”에 영향을 주게 됨으로써 큰 주목을 받았는데, 코로나19 또한 전 세계 흐름을 바꿀 만큼 영향을 주고 있다. 가장 대표적으로 “비대면(언택트, Untact)” 등장이다. 비대면은 사람 간의 직접전이 대면 대신에 디지털을 통해 대면하는 현상을 뜻하는데, 바람직하지 않다. 그리고 부정적이기까지 하다. 이에, 서강대 교수 박수용은 디지털과 컨택(Contact)의 합성어로 디지택트(Digitact)를 제안하바 있다(3). 디지털로 접촉한다는 뜻이다. 부정적이지 않으면서도 코로나19로 인한 현상을 정확하게 짚는 어휘이다.

 

정리하면, 4차 산업혁명을 디지털 전환을 가속화시키고 있다. 그리고 포스트 코로나는 디지택트라는 새로운 패러다임을 제시하고 있다. 결국에는 이러한 요인은 신원 인증에 커다란 영향을 미치고 있다. 본고에서는 신원 인증 산업에 변화되는 요인을 살펴보도록 하겠다.

 

신원인증 시장 변화 요인

 

신원인증 시장은 3가지 요인으로 변화에 직면해 있다. 앞서 언급했듯이, 4차 산업혁명(디지털 혁명)과 포스트 코로나(디지택트)가 2가지 요인을 차지한다. 다른 요인은 개인정보보호 강화이다. 디지털 혁명, 디지택트, 개인정보보호 등 요인이 신원인증에 영향을 주고 있는 셈이다.

 

4차 산업혁명은 디지털 세계를 더욱더 중요하게 했는데, 이는 “디지털 신원인증” 또한 중요하게 만들었다. 예를 들어, 인터넷 초기에는 정보공유만 가능했다. 그러나 현재는 금융, 쇼핑 등 여러 오프라인 업무를 디지털 플랫폼을 통해 처리할 수 있다. 이는 디지털 플랫폼의 업무 처리 중요도가 더욱더 커졌음을 의미하는데, 그만큼 신원에 관한 인증도 강화될 수밖에 없다. 이처럼 4차 산업혁명은 디지털 신원인증을 더욱더 강화시킬 전망인데, 디지털 플랫폼으로 공장 내 전체 서비스를 제어할 수 있다고 생각해보자. 접근권한을 더욱더 강화할 수밖에 없다. 디지털 신원인증이 더욱더 중요해질 수밖에 없는 이유이기도 하다.

 

포스트 코로나는 디지택트를 불러왔다. 이는 신원인증 방식에도 변화를 주고 있다. 직접적인 접촉 방식을 꺼리는 셈이다. 이에 따라 코로나19는 디지털 플랫폼의 역할을 더욱더 중요하게 만들고 있는데, 이 또한 디지털 신원인증을 더욱더 중요하게 만들고 있다. 물리인증 방식에도 접촉을 꺼리는 변화가 포착되고 있다. 따라서 직접 접촉을 대신하는 물리 인증 방식이 선호되고 있다.

 

개인정보보호강화는 신원인증에 있어 불필요한 개인정보를 가져가지 못하게 하고 있다. 이는 인증방식에 있어 방식의 주체를 바꿨다. 중앙기관, 중개기관이 아닌 개인이 인증하는 방향으로 바꿨다. 참고로 이를 자기주권(SSI)라고 한다. 그뿐만 아니라, 개인이 개인 데이터에 이력 접근을 확인할 수 있게 하는, 이력 추적방식의 인증도 적용되고 있다.

 

4차 산업혁명은 디지털 신원인증을 중요하게 하고 있다. 포스트 코로나는 감염 여부도 신원인증에 포함하게 하고 있는데, 이에 따라 이력추적을 중요하게 하고 있다. 그리고 앞서 언급했듯이, 포스트 코로나 또한 디지털 신원인증을 중요하게 만들고 있으며, 물리인증에서는 접촉의 대안이 떠오르고 있다. 온·오프라인 연계(O2O) 인증과 원거리 생체 인증을 대두시키고 있다. 끝으로 개인정보보호 강화는 신원인증에 본인의 권리를 강화하는데, 이는 자기주권신원증명(SSI, Self-Sovereignty Identity)을 등장시켰고, 본인 이력에 열람에 관해 추적할 수 있는 “이력추적”을 중요하게 하고 있다. 그뿐만 아니라, 본인의 정보를 직접 드러내지 않고 신원을 인증받게 하는 것도 주목받는데, 이에 따라 O2O인증도 주목받게 하고 있다.

 

정리하면, 신원인증 시장은 3가지 변화 요인으로 인해 2가지 변화를 맞이하고 있다. 하나는 블록체인과 융합이고, 다른 하나는 인증 체계 변화이다. 전자에는 자기주권과 이력추적의 변화가 나타나고 있다. 그리고 후자에는 디지털 신원인증 강화, O2O인증과 원거리 생체인증이 더욱더 주목받고 있다.

 

후반부에서는 두 가지 변화 중심으로 신원인증 변화를 주제로 살펴본다. 참고로 이러한 변화가 개별적으로 일어나는 것은 아니다. 유기적으로 서로 영향을 주면서 변화에 영향을 주고 있기 때문이다. 예를 들어 자기주권과 O2O인증은 서로에 영향을 주고 있다. 자기주권에서는 O2O인증 방식으로 본인이 원하는 방식으로 신원인증에 필요한 개인데이터를 제공하게 한다.

 

블록체인 융합

 

블록체인은 신원인증에 새로운 변화를 주고 있다. SSI와 이력추적이 이에 해당한다. 표 1은 위 내용을 정리한 것이다. 그럼 개별적으로 살펴보도록 하겠다.

 

 

블록체인과 신원인증 결합으로 인한 변화

구 분 세부내용
SSI 블록체인 기반 탈중앙신원(DID)와 영지식증명알고리즘(ZKP)를 이용해 신원인증을 사용자가 직접 주도해 인증 받는 방식
이력

추적

접근이력 접근이력은 개인 데이터에 접근한 내역을 보여주는 서비스. 블록체인은 이를 기반으로 개인데이터 접근을 강화함으로써, 개인정보보호를 강화함
유통 이력 데이터 내용을 서로 공유하는 서비스. 포스트 코로나 시대에는 이러한 부분이 활용돼, 전염병 진료 기록이 공유될 것으로 보임. 이로 인해, 사용자는 중복으로 전염병 확진 여부를 받을 소지가 줄어드는 편의를 누릴 수 있음

 

SSI는 본인이 주도권을 가지고 인증 데이터를 가지고 특정 기관에 신원을 인증받게 하는 기술이다. SSi는 디지털 신원인증 3세대로 볼 수 있다. 1세대는 개인이 여러 기관에 여러 인증 방식을 가지고 인증했다. 2세대는 통합인증이다. 중개자가 이러한 인증을 수행함으로써, 개인은 복수의 인증이 아닌 단일의 인증을 가지는 편의성을 누릴 수 있었다. 그러나 이러한 점은 빅 브러더와 같은 문제를 일으킬 수 있다. 개인의 접근 이력이 중개 기관에 넘어갈 소지가 있기 때문이다. 이러한 이유로, 3세대 인증 체계인 SSI가 등장했다.

 

SSI에서 “주도권”이라는 단어에는 두 가지 의미가 내포돼 있다. 첫째는 개인이 인증 데이터를 보유하고 있어야 한다. 개인이 인증 데이터를 보유하고, 기관에 증명하는 것이다. 이러한 기술에 “탈중앙신원인증(DID)”가 사용된다. DID는 개인이 인증에 필요한 개인 데이터를 보유하고, 이러한 데이터의 신뢰를 블록체인으로 인증받게 하는 방식이다. 예를 들어, 사용자는 본인 신원 인증을 위해 기관에 인증 관련 데이터를 제출한다. 그럼 해당 기관은 이러한 데이터 유효성을 블록체인에서 확인할 수 있다.

 

둘째는 데이터 제공의 주도권이다. 개인은 증명에 필요한 데이터만 제공할 수 있다. 이는 개인 정보를 강화하는 효과를 가져온다. 불필요한 개인 데이터를 제공하지 않아도 되기 때문이다. 이러한 방식에 영지식증명알고리즘(ZKP, Zero Knowledge Proof) 기술이 활용될 수 있다. ZKP는 데이터를 직접 제공하지 않고, 진위를 인증받는 기술이다. 대표적인 예로, 해시알고리즘이 있다. 사용자는 개인 데이터 대신에 해시알고리즘의 산출 결과를 제공함으로써 개인데이터를 보호하면서 인증받을 수 있다. 비밀번호가 이처럼 움직이는데, 기관은 개인 비밀번호가 아닌 비밀번호의 해시값을 관리한다. 참고로 해시 산출 값으로 비밀번호를 알아낼 수 없다. 역 추적이 불가능하기 때문이다. 따라서 개인 비밀번호는 관리자에게 노출되지 않는 장점이 있다.

 

참고로 DID는 ZKP를 적용한 경우가 많고 SSI 목적으로 개발하고 있기 때문에, DID를 SSI로 보는 경우가 많다. 다시 말해, DID 등장이 SSI 구현을 가져온 셈이다.

 

DID 산업은 2020년을 기점으로 활발하게 성장하고 있다. 한글과컴퓨터(한컴)은 “라이프 블록체인”이라는 서비스를 2020년 국제전자박람회(CES 2020)에서 선보였는데, 출생에서부터 경력, 학력 등을 DID로 인증할 수 있게 하는 서비스이다. 병무청은 이미 DID 인증 서비스를 운영하고 있다. 2020년 1월 병무청은 DID 기반 “간편인증앱”을 선보였는데, 공인인증 없이 본인을 인증할 수 있는 것이 특징이다. DID 확산을 위한 협의체도 등장했다. 현재 협의체는 크게 두 갈래로 나뉜다. SK텔레콤, 케이티, 엘지유플러스 등을 중심으로 한 ‘이니셜 컨소시엄’이 있고, 아이콘루프를 중심으로 한 “마이아이디 얼라이언스”라는 협의체가 있다. 두 협의체를 중심으로 DID 산업이 확산될 전망이다.

 

두 번째는 이력추적에 관한 부분이다. 이력추적은 크게 접근 이력과 유통 이력으로 나눌 수 있다. 접근 이력은 “누가 데이터에 접근했는지”를 알 수 있게 한다. 블록체인에서 접근 이력은 데이터 이용 주체가 데이터 생산 주체에게 토큰으로 보상하는 방식으로 서비스를 제공한다. 이러한 방식은 개인정보보호 강화 추세에 대응할 수 있게 한다. 대표적인 예로, 구글은 영국의 건강보험공단(NHS, National Health Service)과 협력해 개인의료정보를 블록체인 기반으로 거래하는 시스템에 관해 연구 중이다(4). 2018년 BMW는 운전자 행위 이력을 거래하는 블록체인 기술을 개발해 실증한 바 있다(5). 참여 운전자에게는 모비코인(MobiCoin)을 제공하는데, 해당 코인으로 BMW에서 제공하는 상품을 구매할 수 있다.

 

유통 이력은 데이터 유통의 과정에서 기록하는 것을 말한다. 대표적인 예로 식품유통 이력 관리를 들 수 있다. 월마트는 생산지에서의 식품 이력을 블록체인으로 추적하는 시스템을 개발한 바 있다. 포스트 코로나에서는 전염병 여부 확인을 위한 용도로 활용될 전망이다. 대표적인 예로, 한국임상의학연구소는 블록체인 기술을 활용해 코로나19 검사 여부를 받았는지를 증빙하는 서비스를 개발 중이다. 이러한 기술은 공항 코로나19 입출국 검사를 간소화할 수 있다. 사용자가 이미 코로나19 검사를 마치고 이러한 결과를 개인적으로 가지고 있다면, 공항 입출국에서 중복으로 받을 필요 없기 때문이다. 개인이 이러한 검사 받은 내용을 증명하면 된다. 또한, KT는 빌앤멜린다게이츠재단으로부터 3년간 투자를 받아 “감염병 확산 경로 예측”에 관한 기술을 개발 중이다. 그중 블록체인도 활용될 계획이다.

 

인증 체계 변화

 

앞서 언급한 요인은 인증 체계를 변화하고 있는데, 디지털 신원인증, O2O 신원인증, 원거리 생체 인증 등을 주목받게 하고 있다.

 

디지털 신원인증은 4차 산업혁명과 포스트 코로나로 인해 주목받고 있다. 특히, 포스트 코로나는 재택근무, 원격진료 등 디지털 대면으로 오게 함으로써 디지털 신원인증을 중요하게 하고 있다. 따라서 디지털 신원인증은 편리하면서도 강력한 인증 보안이 요구되고 있다(6). 이에 따라, 2가지 접근법이 요구되고 있다. 첫째는 생체인증과 결합한 2중인증이다. 생체인증은 비밀번호 입력 방식과 달리 간편하게 본인 인증이 가능하다. 따라서 생체인증을 추가한 신원인증은 간편하면서도 보안을 더욱더 강화하는 효과를 불러온다.

 

둘째는 상황 분석이다. 행위분석 기술을 활용해 비이상 접근이 요구될 때, 시스템이 이를 감지하는 것이다. 예를 들어, 갑작스럽게 다른 국가에서 디지털 신원인증이 이뤄질 때, 시스템이 이를 의심하고 사용자에게 알리는 방식이다. 혹은 공공장소에서 디지털 신원인증이 들어올 때, 주요정보 접근일 경우에는 이를 차단할 수 있다. 공공장소에서의 주요정보 열람을 타인으로부터 데이터 유출이 일어나게 할 수 있기 때문이다. 마이크로소프트(MS), IBM, 마이크로포커스(MicroFocus) 등의 회사가 이러한 신원인증을 개발하고 있다.

 

O2O 신원인증은 오프라인에서의 신원인증을 온라인 방식을 이용하는 시스템을 뜻한다. O2O 신원인증은 2가지 요인으로 인해 주목받고 있다. 첫 번째 요인은 개인정보보호이다. 신분증을 직접 건네는 방식은 타인에게 과도한 개인 정보 유출을 야기할 수 있다. 필요한 만큼 보이거나, 네트워크 간 인증으로 개인데이터를 타인에게 노출 없이 인증 받을 수 있는 기술이 필요하다. 두 번째 요인은 디지택트이다. 코로나19는 직접적인 대면을 피하게 하고 있다. 이에 따라, O2O 방식으로 접근하는 방식이 주목받고 있다. 대표적인 예로, 정부가 추진하는 모바일 신분증을 예로 들 수 있다. 모바일 신분증은 직접적인 정보 노출 없을 뿐만 아니라 대면하지 않고도 본인임을 인증할 수 있다.

 

원거리 생체 인증은 물리적 신원인증 환경에서 대면하지 않고 신원인증하는 방식을 뜻한다. 지문방식의 물리적 신원인증은 접촉으로 이뤄진다. 다른 사람과의 간접적 접촉이 이뤄지게 하는데, 이러한 방식은 사람들이 간접접촉으로 인한 코로나19 감염에 불안하게 한다. 따라서 최근에는 얼굴인식, 홍채인식 등과 같은 원거리 생체인증이 대두하고 있고, 다양한 인증 방식이 개발되고 있다. 대표적인 예로, LG CNS는 마스크를 써도 얼굴인식이 가능한 기술을 선보였다. 삼성 에스원은 0.3초 만에 얼굴인식 가능한 기술을 선보였다. 이는 사람이 자연스럽게 본인 인증을 받을 수 있게 했다. 그 외 유니온커뮤니티는 50cm 거리에서도 홍채인식이 가능한 기술을 선보였다.

 

지금까지 내용을 정리하면, 앞서 언급한 변화 요인들은 신원인증을 변화시키고 있다. 블록체인 융합과 인증 체계 변화가 예상되고 있다. 이러한 추세는 신원인증 산업을 더욱 더 발전시킬 전망이다.

 

 

 

빅데이터로 인한 AI혁명

그런데 이러한 AI 혁명에는 “빅브라더”라는 어두운 그림자가 있다. 빅브라더는 사회적 통제를 목적으로 사생활 정보까지 침해하는 경우를 뜻한다. 빅데이터 3V를 언급했다. 이러한 3V는 AI 혁명을 가져왔으나, 오히려 빅브라더를 부추길 수 있다.

규모는 사생활 데이터 피해를 확장한다. SNS에는 인터넷 시대보다 수많은 사생활 데이터가 있다. 그뿐만 아니라, IoT는 개인 가정에도 활용될 수가 있는데, 이러한 데이터 수집 또한 사생활 정보를 침해할 수 있다. 속도는 이러한 데이터를 빠르게 분석할 수 있게 하고, 다양성은 이러한 데이터를 기존보다 더 효율적으로 분석해 개인을 좀 더 효율적으로 감시할 수 있게 한다.

 

결국, 빅데이터에 의한 AI 혁명은 2가지의 대립하는 정책을 가져왔다. 하나는 개인 데이터 보호를 위한 정책 강화이다. 그런데 이는 AI 발전을 저해한다. 또 다른 하나는 데이터 활용 강화이다. 이는 AI 발전을 가져올 수 있으나, 개인 데이터 침해 소지 확률을 높인다. AI의 발전과 규제의 정책이 동시에 유발되고 있던 셈이다. 혹은 개인 데이터 보호 강화와 침해 허용 강화가 동시에 발생하고 있다.

 

데이터 보호 강화 사례로는 유럽연합(EU)가 2018년 5월에 시행한 개인데이터보호규정(GDPR)이 있다. 참고로 GDPR은 개인의 데이터를 무작위로 수집할 수 없고, 이를 저장과 가공할 수도 없다. 이에 반해, 2020년 1월에 통과한 데이터 3법은 개인정보보호법·정보통신망법·신용정보법 등 3개의 정보보호법에 관한 개정하는 내용을 담고 있는데, 주요 사항은 사업자가 개인식별정보를 익명 처리해 데이터를 활용할 수 있도록 허용하는 것이다.

 

데이터 3법이 개인식별정보를 익명화해서 사용하는 법안이라도 하더라도, 일부 사람은 이러한 활용에 불편함을 느끼고 있다. 본인을 알아보지 못한다고 하더라도, 사생활 데이터 노출이 꺼릴 수밖에 없다. 이를 보여주는 대표 사례가 AI 음성 스피커로 인한 데이터 침해 논란이다.

2019년 하반기에 AI 스피커 기업이 사생활 음성 데이터를 수집하고 활용하자, 많은 사람이 이에 관해 불편한 심기를 내비쳤다. 물론, AI 스피커 기업은 사생활 침해 목적으로 데이터를 수집한 것은 아니다. 음성인식 목적이었을 뿐이다. 그리고 데이터 수집 범위 또한 제한적이었다. AI 스피커에 음성 명령어만을 수집대상으로 무작위로 한정했기 때문이다. 그러나 많은 사람은 이에 불편한 심기를 드러냈다. 특히, AI 스피커는 직원을 채용해 실제 음성과 AI 스피커가 인식한 음성을 비교하도록 했는데, 본인의 음성 데이터가 제 3자에게 넘어가는 것 자체가 많은 사람에게 불쾌감을 유발했다. 익명화 처리를 하고 있었음에도 말이다.

 

AI 빅브라더의 원인과 해결방안

 

현재 AI는 빅브라더라는 문제를 불러오고 있다. 이를 해결하기 위해서는 문제점을 분석할 필요가 있다. 기존 AI와 다른점은 데이터를 분석하는 것에 있다. 현재 AI는 데이터 학습으로 구현된다. 즉, 빅데이터 등장이 데이터 수집과 가공을 유발했고 이는 빅브라더라는 문제를 가져왔다.

데이터 흐름도

정리하면, 문제는 데이터 수집과 활용에 있다. 따라서 해결방안은 수집과 활용 대상을 데이터가 아닌 다른 무언가로 바꾸면 된다. 좀 더 엄밀히 말해, AI 학습에 활용되는 것을 데이터가 아닌 것으로 바꾸면 된다. 다행스럽게도 이를 충족하는 기술이 개발되고 있다. 연합학습(Federated Learning)이 이에 해당한다. 연합학습은 데이터가 아닌 학습모델을 취합해 AI를 구현하는 방식이다.

 

연합학습, 엣지 컴퓨팅과 영지식증명알고리즘

 

 

연합학습은 기존과 달리 학습모델을 수집대상으로 정한다. 다시 말해, 사용자 단말기에서 데이터 학습이 이뤄지고, 이러한 학습 결과는 중앙에 모여진다, 그리고 이러한 학습결과를 재 취합해 AI를 구현한다.

 

정리하면, 문제는 데이터 수집과 활용에 있다. 따라서 해결방안은 수집과 활용 대상을 데이터가 아닌 다른 무언가로 바꾸면 된다. 좀 더 엄밀히 말해, AI 학습에 활용되는 것을 데이터가 아닌 것으로 바꾸면 된다. 다행스럽게도 이를 충족하는 기술이 개발되고 있다. 연합학습(Federated Learning)이 이에 해당한다. 연합학습은 데이터가 아닌 학습모델을 취합해 AI를 구현하는 방식이다.

 

연합학습에 의한 처리 방식

연합학습은 두 가지 기술을 기반으로 하고 있다. 엣지 컴퓨팅(Edge Computing)과 영지식증명알고리즘(ZKP)를 활용한다. 엣지 컴퓨팅은 연산처리를 중앙이 아닌 개인 단말에서 처리하는 기술이다. 참고로 엣지는 중앙이 아닌 가장자리라는 뜻인데, 다시 말해 가장자리에 위치한 단말기의 컴퓨팅을 이용하는 개념으로 이해할 수 있다.

 

연합학습은 엣지 컴퓨팅 방식을 활용해 개인 단말에 데이터를 학습시켜 학습모델을 나오게 한다. (7)물론, 이러한 결과는 중앙에서 취합하는 학습 과정을 거친다. 중앙 컴퓨팅 파워도 활용하는 셈이다. 엄밀히 말하면, 하이브리드 컴퓨팅(Hybrid Computing)이라고 부를 수 있다. 하이브리드 컴퓨팅은 중앙과 단말의 컴퓨팅을 둘 다 혼용해 활용하는 방식을 말한다.

 

ZKP는 직접적인 정보를 주지 않고 작업을 처리하게 하는 방식을 뜻한다. 그리고 3가지 조건이 있다. 표2를 참조할 수 있다.

 

[표2] ZKP의 3가지 조건

조 건 내 용
완전성 – 충분히 높은 확률로 데이터가 올바름을 알 수 있게 증명해야 함
건전성 – 거짓 데이터를 올바른 것으로 입증할 확률이 충분히 낮아야 함
영지식 – 증명 내용의 사실 여부만을 알 수 있어야 함

 

 

이해를 돕기 위해 예를 들어 설명하겠다. 증명자와 검증자가 있다고 가정해보자. 검증자는 시각 장애인이다. 그리고 검증자에게는 ‘빨간 공’과 ‘흰색 공’이 주어진다. 증명자는 검증자가 색깔이 다른 공을 들고 있다는 것을 증명하고 싶다. 그런데 공 색깔을 말하고 싶지는 않다. 그래서 증명자는 검증자에게 공 색깔을 말하지 않고 증명하는 방법을 고안해냈다.

증명자는 검증자에게 공을 서랍 밑에 숨겨서 증명자가 보이지 않도록 요구한다. (8)그리고 검증자에게 무작위로 공을 들어서 본인이 이전 공 색깔과 다른지 아닌지를 맞추게 하라는 요청을 준다. 검증자는 먼저 첫 번째 공을 꺼내고 두 번째 공을 꺼낸다. 증명자는 공 색깔이 첫 번째의 것과 동일 유무를 맞춰야 한다. 공 색깔이 정말로 다르다면, 검증자는 100% 확률로 다름을 증명할 수 있다. 그러나 공 색깔이 같다면, 시도 횟수가 늘어날수록 맞출 확률은 낮아진다. 공 색깔이 비슷하므로 어느 공을 선택해 들었는지 알 수 없다. 검증자는 1/2 확률로 답을 맞힐 수 있다. 이러한 시도가 10번 일어나면, 증명자가 연속으로 10번 맞출 확률은 1/1024(2분의 1의 10제곱 수) 이다. 이는 맞출 확률이 매우 낮음을 의미한다. 따라서 증명자가 공의 색깔을 모두 맞춘다면, 검증자는 공 색깔이 다름을 확신할 수 있다.

 

ZKP는 전혀 새로운 방식이 아니다. 예전부터 활용되어온 기술이다. 대표적인 예로, 비밀번호가 있다. 비밀번호는 중요 정보이다. 본인 외에는 알아서는 안 된다. 이는 계정 관리자에게도 해당한다. 따라서 현재 비밀번호 체제는 해시함수를 사용하는 방식으로 이용한다. 해시함수는 특정 값을 임의 변수로 바꿔준다. 특정 값이 아닌, 임의의 변수를 활용해 저장하기 때문에 비밀번호를 알 수 없다. 임의 변수에서 특정 값을 알아내지 못하도록 막혀있기 때문이다. 따라서 사용자는 본인이 비밀번호를 입력하면, 이러한 값이 특정 값으로 바뀐다. 그리고 중앙 시스템은 이렇게 바뀐 특정 값의 일치 여부를 통해 계정주인 여부를 확인한다.

 

연합학습 원리또한 영지식증명알고리즘을 활용한다. 연합학습은 직접적인 데이터를 수집하지 않는다. 학습에 필요한 모델을 추출한다. 이러한 추출 방법은 다양하다. 결국, 영지식증명알고리즘 방식의 연합학습은 게인 데이터가 중앙으로 전송되지 않게 함으로써, 개인 데이터를 보호할 수 있게 한다.

 

연합학습과 온디바이스 AI

 

온디바이스 AI(On-Device AI)는 연합학습과 혼동되어 자주 사용된다.(9) 두 기술 모두 엣지 컴퓨팅 방식으로 동작하기 때문이다. 그러나 2가지 차이점이 있다. 첫째는 엣지 컴퓨팅 활용 대상이다. 연합학습은 데이터 학습을 위해 엣지 컴퓨팅을 활용한다. 이에 반해, 온디바이스 AI는 이미 중앙 AI에서 만들어진 알고리즘을 가지고 서비스 제공하는 부분에서 활용된다. 다시 말해, 연합학습은 AI 서비스 제공을 위한 학습 모델 추출에서 엣지 컴퓨팅이 활용되는 반면, 온디바이스 AI는 서비스 제공을 위해 엣지 컴퓨팅이 활용 된다. 그리고 ZKP 활용 여부 차이가 있다. 연합학습은 데이터를 다룬다. 직접적인 데이터가 아닌 학습모델을 전송함으로 ZKP 모델에 착안한다. 그러나 온디바이스 AI는 이러한 활용과 관련이 없다. 참고로 두 기술을 모두 혼용해서 활용할 수 있다. 기기에서 데이터 학습뿐만 아니라, 온디바이스 AI 구현도 가능하다. 표3은 두 기술을 구분해 공통점과 차이점을 정리한 것이다.

 

  연합학습 온디바이AI
공통점 엣지 컴퓨팅 활용
차이점 데이터 학습 범위

ZKP 적용

AI 서비스 제공 범위

ZKP 미적용

[표3] AI의 구분

결언. 연합학습 현황과 블록체인의 융합 가능성

 

연합학습은 현재 시작 단계이다. 사용자 기기에 데이터 학습해 모델을 추출하는 것에는 컴퓨팅 파워 제약의 문제가 뒤따르기 때문이다. 그러나 일부 글로벌 기업에서는 AI 빅브라더 문제를 해소하고자 연합학습을 도입하고 있다. 대표적으로 엔비디아(NVIDIA)를 들 수 있다. 엔비디아는 의료용 AI 플랫폼을 제공한다. 의료 데이터는 개인 민감 데이터가 많이 있는데, 사생활 데이터 우려를 방지하기 위해 연합학습을 적용했다. 구글의 경우, 연합학습 활성화를 위해 AI 오픈소스인 텐서플로우에서 연합학습을 제공하고 있다.

 

앞으로 연합학습은 빅브라더 문제가 없는 AI를 위해 크게 발전할 것으로 보인다. 특히, 블록체인과도 함께 많이 연구되고 있다. 사용자 기기에서 온 데이터의 신뢰성에 관한 부분의 문제를 블록체인이 해소할 수 있기 때문이다. 경희대학교는 논문에서 ‘FL체인’이라는 블록체인 기반 연합학습을 소개했다. 연세대학교는 ‘블록FL’이라는 시스템을 소개하면서 블록체인과 연합학습의 아키텍처를 제안했다. 탈중앙기계학습코인(DML)은 블록체인으로 분산화된 기계학습 프로토콜 개발을 목표로 하는데, 블록체인과 연합학습을 결합한 것이다. 콘센시스헬스(ConsenSys Health) 또한 의료 데이터 보호 목적으로 블록체인 기반 연합학습을 제안하고 있다.

 

본 원고는 KISA Report에서 발췌된 것으로 한국인터넷진흥원 홈페이지(https://www.kisa.or.kr/public/library/report_List.jsp)에서도 확인하실 수 있습니다.

KISA Report에 실린 내용은 필자의 개인적 견해이므로, 한국인터넷진흥원의 공식 견해와 다를 수 있습니다.

KISA Report의 내용은 무단 전재를 금하며, 가공 또는 인용할 경우 반드시 [한국인터넷진흥원,KISA Report]라고 출처를 밝혀주시기 바랍니다.

   [ + ]

1. 유성민, “유럽 인구의 3분 1 사망…세계 뒤흔들었던 ‘흑사병 신드롬’”, 한국경제매거진, 1268호, 2020년 03월.
2. 캐서린 에션버그, “목욕, 역사의 속살을 품다”, 2010년 11월.
3. 한국경제, “[전문가 포럼] 언택트 아닌 디지택트 시대다”, 2020년 06월.
4. 이코노믹 리뷰 (2017.03), “딥마인드 헬스케어, 정보 수집 논란에 블록체인 기술 도입”,http://www.econovill.com/news/articleView.html?idxno=310857.
5. Coindesk (2018.05), “BMW Test Drives Blockchain for Car Mileage Tracking”,https://www.coindesk.com/blockchain-startup-tracks-vehicle-mileage-with-bmw/.
6. Andras Cser and Merritt Maxim, “The Future Of Identity And Acess Management”. Forrester,pp.1-16, June 2019.
7. 유성민, “클라우드, 포그 컴퓨팅-블록체인과 함께 가야”, 동아비즈니스리뷰, 281호, 2019년 9월.
8. 사이언스타임즈, “영지식증명으로 개인 데이터 보호 강화”, 2019년 11월.
9. HACKERNOON, “A Beginners Guide to Federated Learning”,https://hackernoon.com/a-beginners-guide-to-federated-learning-b29e29ba65cf
Recent Posts
Contact Us

언제든지 편하게 연락주세요.

Not readable? Change text. captcha txt