[Vol.6] 네이버 AI NOW’ 리뷰: 한국어 초거대 언어 모델로 탄생한 서비스는 소비자에게 어떻게 체감될까?

 In KISA Report

네이버 AI NOW’ 리뷰: 한국어 초거대 언어 모델로 탄생한 서비스는 소비자에게 어떻게 체감될까?

최홍규 ([email protected])

EBS 연구위원 / 미디어학 박사

네이버 웹을 검색하던 중 눈에 띄는 문구가 보였다. 바로 ‘NAVER AI NOW’라는. 마치 미국 애플(Apple Inc.)의 신제품 쇼케이스를 연상시키는 웹페이지 메인화면 때문인지 호기심이 발동했다. 그래도 네이버는 1위 포털 기업이니! ‘AI 기술을 활용한 서비스를 다양하게 많이 만든다고 하겠지….’, ‘다른 글로벌 서비스들에 대응할만한 혹은 유사한 서비스들을 출시하겠지….’ 이런 생각이 들다가도…. ‘하지만 글로벌 기업들보다 이용자들의 구미를 당길만한 서비스를 출시할 수 있을까?’ 뭐 이런 생각의 흐름을 겪으며 ‘NAVER AI NOW’라는 문구를 클릭했던 것 같다.

네이버에서 새로운 AI 서비스를 출시한 것이겠거니 예상은 되었지만 이보다는 어떠한 ‘차별화된’ 서비스 내용을 어떠한 방식으로 이용자들에게 전달할지에 관심이 더 쏠렸던 것이 사실이다. AI는 현재 ICT 기업들이 서로 선점하겠다는 치열한 시장이고 그래서 이용자들은 다양한 서비스를 기대하고 있지만, 한편으로는 이용자에게 몸소 체감되지 않는 서비스들이 다수 출시된 상황이어서 AI 서비스에 대한 이용자의 피로감이 쌓여있다. 그러니 사실 AI 기술에 관해 속속들이 알지 못하는 필자도 네이버가 어떠한 AI 서비스를 출시한다는 것에 대한 기대감보다는, 네이버가 기존과 다른 AI 서비스를 어떠한 흥미 요소를 가미해 이용자들에게 소개할 것인지에 대한 관심이 컸다.

그래서 이번 원고에서는 AI 기술에 관해서는 아주 조금 아는 이용자의 관점에서 2021년 5월 25일 공개된 ‘NAVER AI NOW’를 리뷰해 보고자 한다. 국내 1위 포털 사업자가 AI 서비스를 출시한다고 하면 정말 많은 이용자가 관심을 안 가질 수 없는데, 이번 원고에서는 AI 기술에 대해서는 비전문가인 이용자 관점에서 ‘NAVER AI NOW’가 어떤 식으로 해석될 수 있을지 이를 논점으로 삼아 글을 써보고자 한다.

네이버 AI’ = ‘HyperCLOVA’

네이버가 AI 서비스를 제공하며 불리고 싶은, 불려야 하는 브랜드

일단 이번 NAVER AI NOW 행사를 통해 네이버가 말하고 싶었던 골자를 파악해보자. NAVER AI NOW는 실제 네이버 AI 서비스 개발에 참여한 임직원들이 발제자로 나선 점이 신선한데, 발제 내용에서 가장 많이 등장하는 단어가 있다. 바로 ‘HyperCLOVA’다. 클로바(CLOVER)는 네이버의 AI 서비스이자, 네이버와 자회사 라인(LINE)의 AI(Artificial Intelligence) 기술을 연구하고 개발하는 조직이다. 그런데 이번에는 ‘하이퍼(Hyper)’를 붙여서 보다 진보한 AI 기술이자 서비스를 표현하고자 한 것이다. 네이버는 이러한 HyperCLOVA를 완성하기 위해 그간 독자적인 기술력으로 자연어처리, 음성 인식, 음성 합성, OCR(optical character reader)과 같은 기술들을 개발했다고 한다.

그렇다. 이번에 네이버가 개최한 NAVER AI NOW의 골자는 바로 네이버의 AI 기술이나 새로운 서비스의 방향성을 일컫는 ‘HyperCLOVA’를 소개하고자 한 것이다. 네이버 홈페이지를 통해 대대적으로 홍보하던 NAVER AI NOW의 목적이 단지 새로운 AI 서비스 출시에 불과하다고? 라고 생각할 수 있다. 그러나 HyperCLOVA를 바라보는 네이버의 관점은 그리 단순하지 않다. 단순히 글로벌 ICT 기업의 서비스들과 경쟁하는 고만고만한 유사 서비스를 출시하며 발표한 개념이라기보다는, 우리나라 포털 사업자 1위이기에 할 수 있는 AI 서비스를 소개하며 네이버의 AI 서비스 비전을 선보인 것이다. (사실, 필자는 이렇게 생각하는데, 이에 비해 언론이나 여론의 화제성은 많이 부족했다고 생각한다.)

HyperCLOVA를 가능하도록 하는 3요소(1)

가만히 이번 행사에 발제된 내용을 보면, HyperCLOVA는 단순히 네이버의 독자적인 AI 기술만을 뜻하는 단어나 개념이 아니다. 독자적인 기술이자, 서비스이자, 새로 정착될 패러다임이자 방법론이고, 혹은 비즈니스 모델이라고도 할 수 있겠다. 그래서 HyperCLOVA를 완성하는 데에는 네이버가 가지고 있는 리소스를 최대한 발굴하고 활용하는 방식의 과정을 거쳤다.

반도체 집적도 수준 향상과 AI 모델 파라미터 수 증가에 따라 발전하는 서비스

행사 초반의 발제문에도 드러나 있는데, AI 모델을 진보시키기 위해서는 파라미터 수가 중요해진다. 마치 반도체 집적도 수준이 향상됨에 따라 새로운 ICT 기술이 태동해왔듯이, AI 모델 파라미터 수가 증가함에 따라 AI가 수행할 수 있는 영역은 더욱 확장될 수 있고 더욱 지능화된 서비스가 출현할 수 있게 된다는 원리다.

네이버는 이에 착안하여 700pf(페타플롭스) 이상의 성능을 갖춘 슈퍼컴퓨터를 도입하여 더 많고 더 복잡한 정보를 처리할 수 있도록 AI 서비스 인프라를 구축했다. 2020년 12월 국내 최대규모의 슈퍼컴퓨팅 인프라를 확보한 것이다. 또한, 이를 기반으로 한국어 초거대 언어 모델을 구축하여 세계에서 가장 큰 규모의 한국어 언어모델을 완성했다고 한다. HyperCLOVA는 바로 이러한 슈퍼컴퓨터라는 첫 번째 요소를 기반으로 완성된 것이다.

국내 1위 포털 사업자이기 때문에 네이버에는 가장 많은 이용자 데이터가 쌓여있다. 이러한 이용자 데이터 중에서는 한글 검색 서비스에서 축적된 한국어 데이터가 대용량으로 축적되어 있는데, 여기서 HyperCLOVA의 두 번째 요소가 확보된다. 바로 대용량의 데이터이다. 전 세계에서 가장 많은 한국어 데이터를 보유하고 있다는 점을 강점으로 살려 한국어 기반의 서비스를 개발할 수 있었다.

혁신은 자원이나 자본만으로 완성될 수 없다. 하늘 아래서, 그나마 조금이라도 새로운 것을 만들려면, 많은 전문가의 노력이 투입되어야 가능할 것이다. 네이버는 2020년 이미 43편의 논문을 글로벌 학회에 발표했고 2021년인 올해에는 더 많은 연구 업적들을 발표할 것이라고 한다. 한편으로 이러한 연구 성과물이 국내에서만 도출되거나 공유되지 않고, 전 세계에서 공유될 수 있도록 아시아, 북미, 유럽에 연구개발 생태계를 구축했다고 자랑하고 있다.

즉, 네이버의 HyperCLOVA가 전 세계적으로도 그 유사 사례를 찾아보기 힘든 학문성 성과나 기술력을 바탕으로 개발되었다는 말이다. 또한, 글로벌 연구자들과 협업을 통해서는 한국어뿐만 아니라 새로운 서비스의 개발에 이바지할 수 있을 정도로 연구의 성과도 인정할만하다고. 이번 NAVER AI NOW는 메시지를 던지고 있다. HyperCLOVA의 개발에 있어 중요한 마지막 요소인, AI 전문가(AI Specialist)는 이처럼 다양한 학문적 성과를 토대로 성장한 것이다.

네이버가 AI 관련 글로벌 학회에 발표한 논문 수

한국어를 구사하는 진솔하고 똑똑한 친구를 만나다.

또한, 이러한 친구를 새로 만들 수도 다른 사람에게 널리 소개해줄 수도 있다.

NAVER AI NOW의 앞부분에서는 장황하게 네이버가 HyperCLOVA를 왜 만들었고 어떻게 만들었고 이것의 의미는 얼마나 상당한지에 대해서 충분히 밝힌다. 그럼 이용자들에게는 의구심이 생긴다. 도대체 이러한 HyperCLOVA가 이용자들에게는 어떻게 체감되며 기존 서비스들과는 어떠한 차별된 지점들을 발견할 수 있냐는 것이다.

쉽게 말해 이용자는 HyperCLOVA를 이용해 손쉽게 AI 기술이 적용된 서비스를 이용할 수 있다고 한다. 이용자가 중소상인(SME, Small and medium enterprise)인 경우에는 상품 관련 홍보 문구를 만들어내기 쉬워지고, 창작이 필요한 크리에이터는 본인이 원하는 글ㆍ사진ㆍ영상을 손쉽게 편집하고 만들어낼 수도 있다고 한다. 공부하는 학생들은 학습할 내용에 대해 비교, 요약, 쉬운 설명 등을 제공 받기 쉬워지고 누구나 AI와 편안한 대화도 가능해진다고 한다. 이용자에게 HyperCLOVA를 운용할 능력만 있다면, 이용자들은 자신이 원하는 한국어 기반의 서비스를 맞춤형으로 이용할 수 있게 된다는 것이다.

이렇게 다양한 서비스를 위해 네이버의 슈퍼컴퓨터가 중요하긴 중요했나 보다. 이 슈퍼컴퓨터를 통해 기존보다 인공지능 모델 개발 시간을 많이 단축했는데, 이 단축된 시간이 무려 140분의 1이라고 한다. 이렇게 단축된 시간을 기반으로 기존 네이버 언어모델보다도 600배가 큰 한국어 초거대 언어모델을 구축했으니, 이용자들의 기대는 더욱 커질 수밖에 없을 것이다.

HyperCLOVA가 학습한 한국어 데이터의 양

뉴스 50년 치의 데이터나 블로그 9년 치의 한국어 데이터를 활용해 만든 네이버의 AI 서비스는 구체적으로 어떠한 모습일까? 단연 제일 궁금해지는 것이, AI의 한국어 구사 능력일 것이다. 네이버가 자랑하는 HyperCLOVA의 장점은 이용자와 자연스러운 대화가 가능하다는 것이다.

가령 예전의 AI 음성 서비스들이 한 번의 질문에 한 번만 답하는 단순한 언어 능력을 갖추고 있었다면 HyperCLOVA는 지속해서 대화를 이어나갈 수 있다고 한다. AI가 답한 내용에 대해 이용자가 다시 궁금한 점을 질문한다고 해도 AI는 당황하지 않고 이전의 질문이나 응답을 이해해 대답한다고 한다.

발제를 통해 소개된 내용을 보면 물론, AI가 실제로 이해하는 것이 아니라 실제로 ‘이해하는 것처럼 보이는’ 서비스라는 표현이 맞을 테지만 기존 서비스와 비교하면 분명 차별화 포인트가 발견되는 것이 사실이다. 이용자가 상식적인 수준의 지식을 질문했을 때, 이용자와 AI가 실제 이러한 대화를 이어나갈 수 있다면 이제 AI 스피커를 통한 검색 서비스가 더욱 활성화되는 계기를 마련할 것이니 말이다. HyperCLOVA를 이용하면 20회 이상의 맥락을 이해한 답변이 가능하다 하니 이제 손가락을 써서 검색할 필요가 없는 시기가 다가오고 있음이 느껴진다.

HyperCLOVA에서 가능한 자연스러운 대화

사람들은 오늘날 네이버에서 쇼핑 서비스를 많이 이용하는데, 중소상인이 네이버 쇼핑 서비스를 이용할 때 도움이 되는 서비스도 이색적이다. HyperCLOVA를 이용하면 중소상인이 자신이 판매할 상품에 알맞은 상품 소개 문구를 손쉽게 만들 수 있다. 그것도 해시태그와 함께, 혹은 검색되기 쉽도록 트렌디하게 말이다. 단순히 말도 안 되는 문장을 이어 붙여놓은 수준이 아니라 ‘완내스(완전 내 스타일)’, ‘댕냥이(강아지와 고양이)’와 같이 다수 이용자의 이목을 끌 수 있는 문구들이 상품 소개 문구에 활용되도록 도와준다는 것이다. 네이버는 이러한 상품 소개 문구 생성 서비스를 개발하면서 실제로 적용할 수준을 측정해보았는데, 99%의 확률로 실제 쇼핑 서비스에 적용할 수 있는 수준이었다고 한다.

HyperCLOVA가 생성해내는 상품 소개 문구

흔히 예술의 영역은 AI가 범접하기 힘든 영역으로 꼽혀왔는데, HyperCLOVA로 인해 글쓰기 영역의 예술 분야는 더욱 그 전문성의 개념을 세분화해야 할 것으로 보인다. 단순히 상품 정보를 활용한 글쓰기는 HyperCLOVA와 같은 AI가 수행할 수 있는 ‘AI 전문 영역’이 되어 버릴 것이니 말이다. 이 밖에도 HyperCLOVA는 창작을 위한 글쓰기를 도와주는 도구로 기능할 수 있다고도 한다. 구체적인 예시가 이번에 나오지는 않았지만 머지않아 HyperCLOVA와 관련한 구체적인 서비스들이 출시된다고 하니 이 부분도 주목해봐야 할 부분이다.

HyperCLOVA는 정보를 요약하는 도구로써도 탁월한 기능을 지니고 있다고 한다. 아래 예시에서 HyperCLOVA가 요약한 정보를 보면, 문서들을 취합하여 스스로 새로운 문서를 생산해내는 능력이 이미 어느 정도의 수준에 이르렀음을 알 수 있다. 단, 정보를 요약하는 과정에서의 기준이나 관점은 추후 이용자가 설정할 수 있는 것인지, 정보를 요약하는 과정에서 다양한 이용자 성향에 따라 요약의 내용이 달라지도록 할 수 있는지가 궁금해진다. 왜냐하면, 우리가 이제껏 경험한 텍스트 마이닝(text mining) 도구들의 사례로 볼 때 몇몇 문건을 토대로 새로운 문건을 만들어내는 것이 가능해 보였을지 몰라도, 새로운 관점이나 해석이 접목된 정보를 생산해내는 일은 먼 미래의 일처럼 느껴졌기 때문이다. 이번에 제시된 HyperCLOVA의 사례들을 살펴보면, 이제는 이용자 개개인의 관점이 접목된 정보 요약과 생산이 충분히 가능해 보인다.

HyperCLOVA가 요약한 정보

네이버의 ‘CLOVA AiCall’ 서비스를 살펴보면, AI의 학습을 위해 데이터셋을 자동으로 생성하는 과정이 드러난다. AI 기술을 탑재한 응답기가 자동으로 이용자 요구에 맞는 답변을 생성하도록 사전에 질문으로 나올만한 내용을 학습하여 데이터를 생성해내는 것이다. 더욱 정확하고 빠른 답변이 생성될 수 있도록 하는 원리다.

HyperCLOVA의 데이터 생성 방식

즉, HyperCLOVA를 통해 이용자가 AI를 쉽고 빠르게 이용할 수 있게 된다는 원리도 이미 AI가 엄청나게 많은 양의 데이터를 학습하여 이용자에 맞춤형의 정보를 제공할 확률을 높였기 때문에 가능한 원리다. 진보된 HyperCLOVA를 만드는 체계나 과정에 대해서는 아래 그림도 참고해 볼 만하다.

AI와 관련한 서비스 탐색ㆍ조합ㆍ개발ㆍ공유가 가능한 HyperCLOVA 플랫폼 구성도

위의 HyperCLOVA 플랫폼에서는 이용자가 AI와 관련한 서비스를 조합하여 새로운 AI 서비스를 만들 수도 서로 조합할 수도 있다. 또한, 이렇게 만들어진 AI 서비스들은 다른 사람들과 공유할 수도 있게 된다. 이용자들은 대화가 가능한 AI, 문체 변환 AI, 필터링 AI, 창작하는 AI 등을 만들고 공유하여 다른 이용자에게 새로운 AI 서비스를 개발할 영감을 줄 수도 있다. 그런데 여기서 핵심은 AI 개발 전문가가 아니라고 하더라도 이러한 AI 서비스 기술과 공유가 가능해지도록 그 환경이 만들어진다는 점이다.

대한민국 1위 포털 기업만이 할 수 있는, 해야만 하는, 하고 싶은 서비스.

이용자가 서비스 국적을 따지지 않는 시대에서 그래도 네이버가 가야 하는 길

네이버는 코로나19 기간에 AI 기술을 활용한 응답 서비스인 ‘CLOVA CareCall’을 보급한 바 있다. 성남시에서는 이 서비스로 1년간 10만 건의 상담 민원을 처리했고 코로나19 유증상자 2천 명을 조기에 발견하는 성과를 거두었다고 한다. 그래서인지 현재는 전국 10개 지방자치단체에서 CLOVA CareCall을 도입했다고 한다.

코로나19 상황에서 활용된 전화상담 AI인 ‘CLOVA CareCall’

코로나19라는 국가적 재난 상황에서 대한민국 1위 포털 사업자인 네이버는 나름의 역할을 한 것으로 보인다. ICT 기술을 기반으로 사업을 영위하는 사업자로서 네이버가 기여할 수 있는 일을 했다고 보는 것이다. 코로나19가 만들어낸 시간 동안 많은 국민에게 전염병과 치료법에 대한 정보를 제공하는 일은 다른 어떤 일들보다 중요한 일이었다. 국가적 재난 상황에서 정보의 불균형으로 인한 2차적 재난을 막기 위해서라도 정보제공 서비스가 중요했다. 이처럼 의미 있는 서비스에 AI 기술을 접목했다고 하니, 역시 비즈니스라는 정글에서는 위기가 기회일 수 있다는 생각도 든다.

HyperCLOVA의 존재 이유도 다르지 않다고 생각한다. 대한민국 1위 포털 기업만이 할 수 있는, 해야만 하는 서비스인 것이다. 물론, 네이버에 AI 서비스는 ‘하고 싶은’ 서비스 아이템일 수 있다. ICT 산업 영역에서 시장에 새로운 활력을 제공할 섹시한 아이템이 AI이기 때문이다. HyperCLOVA는 네이버에는 해야 하는 서비스이자 체득해야 하는 패러다임인 셈이다. AI 기술로 인해 네이버의 서비스들은 새로운 혁신이 가능하고 더 많은 이용자가 선택할 가능성이 커지기 때문이다.

네이버 서비스에 적용되고 있는 AI 기술들

오늘날 ICT 기술 기반의 서비스를 이용하는 사람들에게는, 해당 서비스를 제공하는 기업의 국적이 의미 있게 와 닿지 않는다. 사람들에게 이로운, 좋은 서비스를 제공한다면 이 서비스가 태동한 국가는 이용자가 서비스를 선택하는 핵심적인 변인이 되지 못한다. 그래서 필자인 나는 이번 네이버 HyperCLOVA가 네이버가 가야만 하는 길이라고 생각한다. 꼭 성공해서 전 세계에서 확산한 ‘문화 한류’에 ‘ICT 한류’ 현상도 덧붙여 주기를 바라는 마음이다. 오늘도 BTS 노래를 따라 부르는 전 세계의 팬들에게 분명히 매력적인 도구들을 만들어낼 수 있을 것이라 보기 때문에, HyperCLOVA가 그들의 손에 잡히는 일상의 도구가 되어 주길 바란다. 정.말.로. HyperCLOVA가 ‘세계 최고’의 ‘한국어 초거대 언어 모델’로 탄생한 서비스라면 불가능한 일도 아닐 것이다.

네이버가 지향하는 AI 사업의 본질에 관한 코멘트

본 원고는 KISA Report에서 발췌된 것으로 한국인터넷진흥원 홈페이지(https://www.kisa.or.kr/public/library/IS_List.jsp)에서도 확인하실 수 있습니다.

KISA Report에 실린 내용은 필자의 개인적 견해이므로, 한국인터넷진흥원의 공식 견해와 다를 수 있습니다.

KISA Report의 내용은 무단 전재를 금하며, 가공 또는 인용할 경우 반드시 [한국인터넷진흥원,KISA Report]라고 출처를 밝혀주시기 바랍니다.

   [ + ]

1. 본 글에서 인용된 그림의 출처는 NAVER TV에 업로드된 에서 발췌한 것임 URL: https://tv.naver.com/ainow
Recent Posts
Contact Us

언제든지 편하게 연락주세요.

Not readable? Change text. captcha txt