[Vol.5] 구글 I/O 2021에서 발표한 AI 기술과 제품
구글 I/O 2021에서 발표한 AI 기술과 제품
최호섭 ([email protected])
IT컬럼니스트
구글의 개발자 컨퍼런스 ‘구글 I/O 2021’이 지난 5월18일부터 20일까지 온라인에서 개최됐다. 매년 열리던 이 행사는 지난해 코로나19의 여파로 열리지 않았고, 한 해를 걸러 온라인으로 다시 찾아왔다.
최근 구글 I/O에서 공개되는 주요 발표들은 대부분 인공지능 기술과 밀접한 관련이 있다. 두 시간 정도 이어진 이번 구글 I/O 키노트도 인공지능이 구글의 서비스를 어떻게 고도화하고 있는지 살피는 재미가 있다.
구글이 공개한 람다(LaDA)는 인공지능 기반의 언어 모델이다. 람다는 대화 응용 프로그램용 언어 모델(Language Model for Dialogue Applications)을 줄인 말이다. 구글은 이미 높은 수준의 언어 모델을 갖고 있고, 이를 바탕으로 구글 어시스턴트와 듀플렉스를 비롯해, 다양한 서비스에 접목할 수 있는 언어 서비스를 하고 있다. 람다는 여기에서 한 단계 더 나아가 실제 대화를 그대로 모델링하는 서비스다.
#자연스러운 대화, 진짜 ‘말’을 주고받다
순다 피차이 CEO는 람다가 명왕성이 되어서 대화를 나누는 데모를 시연했다. 예를 들어 “내가 명왕성에 가면 뭘 볼 수 있을까?”라고 질문하면 명왕성이 된 람다는 “큰 계곡과 빙산, 분화구 등을 볼 수 있어”라고 답한다. 이용자가 다시 “멋진데!”라고 말하면 “아마도 꽤 괜찮은 여행이 될 거야. 하지만 너무 추우니까 코트를 꼭 챙겨”라고 말한다. “이전에 명왕성에 찾아온 방문객이 있었니?”라는 질문에는 “방문이 흔치는 않지만 뉴 호라이즌스호가 나를 방문 했었어”라는 답을 준다.
일반적으로 구글의 입장에서, 검색 엔진의 역할을 바탕으로 답하는 것이 아니라 정보를 특정 대상의 관점에서 전달할 수 있을 만큼 자연스러운 대화를 할 수 있다는 점이다. 대화에 더 몰입할 수 있을 뿐 아니라 대상체를 바꾸어가며 학습에 직접적으로 도움을 줄 수 있다.
람다가 추구하는 방향성은 자연스러운 대화에 있다. 구글은 언어의 특징에 초점을 맞추고 있다. 언어의 미묘한 변화나 적응력처럼 ‘언어의 살아 있음’에 주목한다. 순다 피차이 CEO가 예로 든 것처럼 “오늘 날씨는 어때?”라고 물으면 컴퓨터는 “오늘 날씨는 맑고, 최고 온도는 20도예요”라고 말하는 것이 일반적이지만, 사람간의 대화라면 “이제 여름이 시작되나보네. 오늘 점심은 밖에서 먹어야겠다”라는 답을 할 수도 있다.
이미 구글은 자연스러운 대화에 대해 오랫동안 고민을 해 왔다. 지난 2018년 구글은 듀플렉스를 내놓으면서 세상을 깜짝 놀라게 했다. 이 서비스는 미리 정해둔 일정을 기반으로 음식점, 미용실 등에 직접 전화를 걸어 예약을 잡는다. 상대방의 말을 인식하고 문맥을 읽어 적절한 응답을 하는 것인데, 당시 너무 자연스러운 대화에 세상이 반가움 보다는 불편함을 더 느끼기도 했다. 하지만 컴퓨터와 나누는 음성 대화가 명령어식이 아니라 맥락을 기반으로 한 자연스러운 대화로 이어지는 것은 큰 전환점이었다.
구글은 이를 바탕으로 구글 어시스턴트에도 한 마디씩의 대화가 아니라 이전 대화가 갖고 있는 의미를 바탕으로 한 문맥 기반의 대화를 붙였다. 이를 통해 구글 어시스턴트는 주어나 목적어를 빼먹어도 어떤 의도로 질문을 하고, 무엇을 요청하는지 파악해 적절한 답을 할 수 있게 됐다.
람다는 다음 단계의 진화다. 그동안 컴퓨터와 나누는 대화는 대부분 주어와 목적어, 서술어를 명확하게 이야기해야 인식률이 높았다. 애초부터 언어 관련 서비스들이 추구했던 방향성은 자연어에 있었고, 어느 정도 자연스러운 문장을 이해하게 되긴 했지만 넓은 의미의 ‘대화’라는 부분을 만족시키지는 못했다.
구글은 사람간의 대화가 특정 주제에 쏠리지 않고, 전혀 엉뚱한 곳으로 흐르는 개방송에 주목했다. 지역 음식에 대한 대화를 나누다가 갑자기 그 지역의 여행이나 경험으로 이야기가 이어지는 경우를 떠올리면 된다. 람다는 대화 전체의 맥락을 읽고 이야기가 흐를 수 있는 모든 가능성을 검토한다. 기계적이로 정확한 정보도 있지만 대화에서 재미와 흥미를 빼놓을 수는 없기 때문에 다양한 관점에서 적절한 언어 습관을 갖추도록 한다는 것이 구글의 설명이다.
#데이터의 다각화, 정보의 확대
구글은 람다를 통해 단순한 대화의 진화가 아니라 컴퓨터와 사람이 소통하는 방법이 변화하는 것을 꾀하는 듯하다. 구글은 텍스트 위주의 정보 접근을 넘어서 다중 모델링(Multi modal model)을 통한 정보 학습 모델 ‘MUM(Multitask Unified Model Introduction)’을 공개했다.
그동안 언어 모델을 학습시키는 주요 자료는 텍스트였다. 구글은 여기에 이미지, 오디오, 비디오 등을 함께 학습시킨다. 새로운 기술이지만 구글은 그동안 구글 포토나 구글 렌즈를 통해 이미지와 영상을 학습시켜 맥락을 읽는 기술을 갖고 있었고, 비정형 멀티미디어 정보들의 해석은 외부의 서비스뿐 아니라 음란물이나 범죄에 기반한 콘텐츠를 찾아내는 데에도 활용해 왔다. 이를 검색에 녹여내서 더 자연스럽게 정보를 집중하는 것이다.
곧 구글의 검색 결과에 이 정보들이 반영된다. 람다의 언어 문맥 기술이 더해져서 온전한 자연어 기반의 검색이 이뤄진다. 질문을 다각도로 이해하고 의도를 파악해 다양한 정보를 통해 정보를 제공하는 것이다.
구글은 MUM을 통한 검색을 시연했는데 상당히 흥미롭다. 이용자는 구글의 검색창에 ‘내년 가을에 후지산 하이킹하려고 하는데, 어떻게 준비하면 좋을까?’라고 입력한다. 검색 엔진의 역할보다는 구글 어시스턴트에게 묻는 질문에 더 가깝다. 하지만 이전까지는 이 질문의 문장과 관련이 높은 웹의 정보가 검색되어서 나왔다면 MUM이 적용된 구글의 답은 ‘이전에 다녀왔던 아담스산과 높이가 비슷하지만 후지산은 가을에 장마가 오기 때문에 방수 재킷을 준비하는 게 좋겠다’라는 메시지와 함께 관련 정보들을 보여주는 것이다. 인터넷에 있는 정보를 직접 찾아서 보여주는 수준을 넘어, 세상의 지식을 바탕으로 통찰력을 갖게 되는 셈이다.
여기에 하이킹용 부츠 사진을 찍어서 이미지 검색에 등록하면 해당 제품을 인식하고 하이킹 하려는 산의 지형과 맞춰본 뒤 적절성을 알려준다. 물론 추천 제품을 함께 보여주어서 쇼핑으로 유도하는 부분도 있지만 다양한 정보를 바탕으로 구글에 질문을 던질 수 있고, 적절한 통찰력을 바탕으로 답을 얻을 수 있게 된다.
이미 이 MUM의 기반 데이터가 여러 언어에 걸친 복합 정보이기 때문에 구글이 예로 든 미국인 입장에서 바라본 후지산 등반처럼 다른 언어에 대한 정보를 제공할 수 있다. 자연스럽게 MUM 기반의 지식 정보 검색은 전 세계 언어로 확장된다.
MUM과 람다는 구글의 본질인 검색에 큰 변화가 생기는 기술이다. 명령어 기반의 소통이 아니라 자연어를 알아듣고 답해주던 구글 어시스턴트를 넘어 문맥에 기반한 대화, 그리고 맥락을 읽는 ‘눈치’가 더해지면서 공상과학 영화 속의 로봇 어시스턴트처럼 자연스러운 대화를 통해 지식을 얻어내는 인터넷 환경이 열리는 셈이다.
#인공지능 기술, 그리고 데이터에 대한 책임
구글은 람다가 만들어내는 대화의 내용이 정해져 있지 않고 모든 가능성이 열려 있다고 설명한다. 이 때문에 구글의 시연처럼 ‘명왕성’의 입장에서 대화를 학습시키는 것이 가능하고, 동물이나 여러 사물도 반영할 수 있다. 당연히 사람이라면 특정 인격을 갖도록 하는 모델이다. MUM 역시 이미지, 소리, 영상 등 다양한 데이터를 받아들이고 통찰력을 보여주는 기술인데 이 정보들은 학습 과정에 따라 결국 윤리적인 문제와 연결될 가능성이 있다.
과거 마이크로소프트의 챗봇 ‘테이’나 최근 국내에서 화제가 됐던 ‘이루다’처럼 대화를 통해 서서히 부정적인 학습 결과를 가져올 수 있다. 특히 람다는 특정 사물의 입장이나 사람의 인격을 가질 수 있기 때문에 잘못 학습되면 국가별, 인종별, 문화별 편견과 혐오를 일으킬 수 있다.
구글은 모든 인공지능 기반 기술을 만들 때 AI 윤리 원칙을 검토하는데, 람다 역시 개발 중인 지금도 AI 원칙을 준수하고 있는지에 대해서 끊임없이 되묻고 있다고 밝혔다. 오해의 소비가 있는 말이나 혐오의 미러링, 불공정한 편견 등에 대해서 경계하고 부정적인 대화가 튀어나오지 않도록 하는 것이다.
인공지능과 클라우드의 발전은 예민한 개인정보와 보안에 대한 우려로 이어진다. 프라이버시와 보안은 그 자체로 흥미롭고 재미있는 주제는 아니지만 최근 구글을 비롯해 많은 테크 기업들의 개발자 컨퍼런스에서 무게를 갖고 다뤄지는 주제다.
특히 많은 개인정보가 담기고, 가장 사적인 기기인 스마트폰에 대해서도 이전과 다른 접근이 이뤄진다. 그동안 안드로이드는 구글 계정에 담기는 여러가지 개인정보들을 바탕으로 연결과 분석을 통해 새로운 정보를 제공했다. 검색에 기반한 관심사 분석뿐 아니라 일정, 위치 정보, 목소리, 메시지, 키보드 입력 등 많은 부분들이 수집, 분석되면서 최적화되어 왔다. 개인의 스마트폰 경험과 동시에 구글의 서비스가 함께 고도화되는 데에 개인의 데이터가 활용됐다.
하지만 프라이버시에 대한 요구가 높아지고, 불안 요소도 많아지다 보니 구글도 데이터 수집과 분석에 대해 점차 보수적인 입장으로 흐르고 있었다. 이번 구글 I/O에서도 프라이버시에 대한 부분들이 강조됐다. 암호 관리도 단순히 저장했다가 자동으로 입력해주는 것을 넘어 사이트별로 비슷하게 쓰는 암호들을 바꿀 수 있도록 관리하고, 보안사고 등으로 위험에 노출된 비밀번호에 대해서도 쉽게 바꿀 수 있도록 관리해준다. 순다 피차이 CEO는 “우리의 미래는 암호 입력 없는 세상이 될 것”이라고 말하기도 했다.
지난달 애플이 iOS14.5와 함께 광고에 대한 프라이버시 보호 정책을 대대적으로 알리기 시작했다. 광고 시장은 타겟 광고의 고도화를 위해 이용자들을 추적하고, 핑거프린트를 기록해 왔고, 운영체제와 디바이스는 이를 막아 왔다. 구글은 어느 정도는 양쪽의 입장을 모두 갖고 있지만 이번 키노트를 통해 개인정보와 광고의 연결에 분명한 선을 그었다.
구글은 제품에서 데이터가 언제, 어떻게 쓰이는지를 밝히고, 활용에 대한 이유도 명확하게 알리겠다고 밝혔다. 또한 개인정보를 누구에게도 판매하거나 넘기지 않고, 이용자들의 저장 데이터를 활용하지도 않는다. G메일이나 구글 포토, 구글 드라이브 등 모든 서비스의 이용자 데이터는 구글 서비스를 위한 분석 대상에 들어가지 않는다. 또한 건강, 인종, 종교, 성적 취향 등 민감한 정보는 아예 쓰지 않는다.
순다 피차이 CEO는 “모든 사람이 자유롭고 개방된 웹을 쓰기 위해 광고가 중요한 역할을 한다고 생각해 왔지만 프라이버시와 보안의 가치도 똑같이 중요하다고 판단한다”고 밝혔다. 구글은 이를 위해 ‘차등 프라이버시(differential privacy)’ 알고리즘을 적용했다. 수집되는 대규모의 데이터는 이용자의 개인정보를 읽어내거나, 이용자를 식별하지 못한다. 또한 앱이나 광고 관련 기업들이 필요에 따라 이 차등 개인정보 기술을 활용할 수 있도록 오픈소스 라이브러리를 만들었다. 이를 통해 암 연구나 인구 조사도 할 수 있다.
머신러닝 활용에도 학습을 위한 원시 데이터를 전송하지 않는다. 특히 키보드 입력 앱은 정확도를 위해서 그동안 구글을 비롯해 많은 기업들이 입력 정보를 수집하는 일이 많았다. 하지만 구글은 이 분석을 기기 안에서만 하도록 바꾸었다. 이 외에도 개인의 습관을 분석해야 하는 안드로이드 기기에서 많은 부분들을 로컬로 옮겨왔다. 2019년에 공개했던 안드로이드의 실시간 자막 기능도 모든 음성 모델을 구글로 보내거나 공유하지 않고 기기에서 오프라인으로 처리한다. 마찬가지로 올 가을 공개될 안드로이드 12는 더 많은 부분들이 스마트폰 안에서 학습, 활용되고 외부로 전송되지 않도록 설계된다.
구글은 이를 위해 안드로이드 프라이빗 컴퓨트 코어를 적용해 개인정보, 사생활과 관련된 데이터에 인공지능 기술이 더해질 때 전송 대신 안드로이드 기기 내부에서 직접 처리하도록 한다. 종종 논란이 되는 구글 어시스턴트를 켜는 ‘헤이 구글’ 등의 콜사인을 비롯해, 음성 분석, 키보드 입력, 사진 관리 등 기기 내부의 예민한 데이터 분석을 위해 구글의 서버에 데이터를 전송해야 하는 부분을 최소화한다.
전체적으로 2021년의 구글 I/O는 위축된 느낌이 있기는 하지만 구글은 여전히 데이터와 인공지능을 바탕으로 기존의 서비스를 고도화하고, 필요에 따라 모듈을 다시 짜맞추어 새로운 서비스를 내놓고 있다. 이전에 없던 기술이 아니라 그동안 구글이 십 수 년 동안 꾸준히 해 왔던 일들, 만들어 왔던 서비스들이 인공지능 기술로 더 정교한 결과를 만들어내고, 새로운 의미와 역할을 바탕으로 재조립되면서 영향력을 자랑한다. 흥분된 분위기나 힘주어 메시지를 전달하지는 않았지만 구글은 지난 몇 년간 걸어왔던 것과 똑같은 페이스로 꾸준히 걸어가고 있다.
한편으로 구글이 이렇게 데이터와 인공지능에 기반한 경쟁력을 갖게 되기까지 쓰인 세상의 정보들에 대해서도 돌아볼 필요가 있다. 정보에 대한 보안과 사생활에 대한 강조는 아무리 해도 지나치지 않는 일이고, 구글도 보안과 프라이버시, 그리고 인공지능의 윤리에 대해서 빼놓지 않고 매년 더 강화된 정책과 기술을 발표하고 있다.
하지만 이미 구글을 비롯한 메이저 테크 기업들은 대부분 프라이버시에 대한 경계가 느슨하던 시절부터 많은 정보를 수집, 분석해 왔고, 이를 통한 분석 모델과 데이터 수집 경험을 확보했다. 앞으로도 데이터에 대한 접근은 더 엄격해질 것이다. 그렇게 세워진 데이터의 장벽은 새로운 기업들의 기회에 영향을 끼칠 수 있다. 프라이버시를 느슨하게 해야 한다는 것이 아니라, 데이터를 안전하게 수집하고 활용할 수 있는 방법에 대해 앞서간 기업들의 생태계에 대한 책임감을 가져야 할 필요가 있다.