프레리스쿠너, 음성 AI 학술대회 논문 채택
다중화자 음성 변조 기술 소개…"익명화로 개인정보 유출 방지"
입력 : 2024-04-19 16:35:24 수정 : 2024-04-19 16:35:24
[뉴스토마토 오승주 기자] 온디바이스 음성 AI 기술을 개발하는 프레리스쿠너가 음성·음향·신호처리 학술대회 'ICASSP 2024'에서 논문이 채택됐다고 19일 밝혔습니다. 
 
프레리스쿠너는 온디바이스 음성 AI 기술과 개인정보보호 기술을 개발하는 스타트업입니다. 지난해 8월 법인 설립 이후 2개월 만에 블루포인트파트너스로부터 시드 투자를 유치하고 핵심 기술을 고도화하고 있습니다.
 
이번에 채택된 프레리스쿠너의 논문 'WAV2VEC-VC: VOICE CONVERSION VIA HIDDEN REPRESENTATIONS OF WAV2VEC 2.0'에서는 화자에 대한 사전 정보 없이도 음성 변조가 가능한 다중화자 음성 변조 기술이 소개됐습니다. 
 
예를 들어 A 화자의 음성을 B 화자의 목소리로 변환하고자 할 때, A 화자 음성에서 언어적 정보를 추출하고 B 화자 음성에서 목소리 정보를 추출합니다. 이후 두 정보를 결합해 A 화자가 발화한 내용을 B 화자의 목소리로 합성하는 방식입니다.
 
특히 해당 기술에서는 메타에서 개발한 자기 지도 학습 음성 표현 'wav2vec 2.0'을 활용해 입력 음성에서 화자의 목소리 및 언어적 정보를 효과적으로 추출하는 데 성공했습니다. 
 
김기연 프레리스쿠너 대표는 "이번 연구 결과는 단순히 음성 변조 작업에만 국한되는 것이 아니라 화자 인식, 화자 분할, 음질 개선, 음성 인식 등 여러 음성 작업에 적용할 수 있을 것으로 기대된다"며 "사용자 간 음성 파일을 공유할 때 해당 기술을 적용해 원본 화자의 목소리를 익명화함으로써 개인정보 유출을 방지할 것"이라고 말했습니다. 
 
프레리스쿠너 로고 (이미지=프레리스쿠너)
 
오승주 기자 sj.oh@etomato.com

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지



  • 오승주

싱싱한 정보와 살아있는 뉴스를 제공하겠습니다!