![]() |
경기를 중계하는 스포츠 캐스터 같은 목소리 톤으로 말하는 음성 AI(인공지능)가 나왔다. 안내 등에 쓰이는 기존 AI의 차분한 음성이 아니라 흥분감이 담긴 음성을 구현한 것이다.
엔씨소프트가 지난 10일 공식 블로그에서 공개한 이른바 '중계체' AI는 경기 상황에 맞는 감탄사나 말을 이어갈 때 사용하는 '음...', '그...', '저...' 같은 자연스러운 간투어, 발화 오류·반복 등을 통해 감정을 표현했다.
글을 읽는 투의 낭독체나 사람들이 대화하는 것 같은 대화체와는 또 다른 새로운 발화 스타일을 AI로 구현했다는 것이 엔씨소프트의 설명이다.
공개된 엔씨소프트의 중계체에서는 선수 소개와 경기 진행 상황 설명 등은 낭독체나 대화체 같은 음성이 구현된다. 하지만 경기가 진행되면 '아, 이런!' 같은 허탈감이나 격한 흥분감을 나타내는 감탄사 등도 표출됐다.
예를 들어 안타와 홈런을 중계할 때, 안타가 터지면 좀 덜 흥분된 목소리로 표현되고 끝내기 솔로 홈런이 터지면 격한 목소리 톤이 구현됐다.
엔씨소프트는 대본이 제공된다면 AI 중계체로 경기 영상을 중계·더빙하는 데 걸리는 시간은 실제 사람이 녹음하는 시간의 10분의 1에 그친다고 밝혔다.
이같은 중계체는 엔씨소프트 AI 센터 산하 스피치AI랩(Speech AI Lab)의 보이스 컨버전팀과 음성합성팀이 개발했다고 엔씨소프트는 밝혔다. 이들 연구팀은 사람의 다양한 억양을 표현하고 제어하는 운율 제어(prosody control) 기술을 연구했다.
최근에도 TTS(Text-To-Speech)와 보코더(Vocoder) 등 음성 합성 기술이 발전해 합성음이 실제 사람 같이 자연스러워지다 보니 이제 감정이 깃든 목소리 구현까지 AI 음성 수요와 연구 영역이 확장되고 있다는 설명이다.
게임 내 영상인 시네마틱 무비와 인게임 컷 씬 등에서 캐릭터 간 복잡한 감정이 깃든 대사가 오가거나 캐릭터 특성에 맞는 발화 스타일이 필요한데 이 때 이같은 운율 제어 기술이 활용될 수 있다고 엔씨소프트는 전망했다.
엔씨소프트는 "이 기술은 이스포츠(e-Sports) 게임 중계나 축구, 농구 등 스포츠 장르 전 분야에 걸쳐 응용될 수 있다"고 밝혔다.
December 13, 2020 at 08:45AM
https://ift.tt/37T3IVa
"네 쳤습니다~ 홈런입니다~" AI가 감정담아 스포츠 중계한다 - 머니투데이
https://ift.tt/37koVGH
Bagikan Berita Ini
0 Response to ""네 쳤습니다~ 홈런입니다~" AI가 감정담아 스포츠 중계한다 - 머니투데이"
Post a Comment