小小游戏网

Meta 发布突破性生成式语音系统,一个通用模型解决多项任务

6月17日,Meta介绍了一种“突破性”的生成式语音系统,它可以合成六种语言的语音,执行噪声消除、内容编辑、转换音频风格等。

Meta称之为最通用的语音生成AI。Meta表示,Voicebox是第一个没有经过专门针对语音生成的训练,却可以泛化到语音生成任务的模型。与图像和文本的生成一样,Voicebox可以创建多种样式的语音输出,包括从头开始创建输出和修改给定的样本。Voicebox 可以合成六种语言的语音,以及执行噪声去除、内容编辑、风格转换和多样化样本生成。

Meta表示,Voicebox作为首个能成功执行任务泛化的高效的多功能模型,将开创一个语音生成式AI的新时代。

但Meta也没有否认这项技术可能被误用乃至被恶意使用。为了应对这种可能性,降低潜在的风险,Meta 还构建了一种分类器,其宣称可有效分辨真实语音和VoiceBox生成的音频。

声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。