ElevenLabs推出创新的多语言翻译AI配音功能

ElevenLabs推出创新的多语言翻译AI配音功能
由谷歌和Palantir前员工创立的初创公司ElevenLabs最近宣布推出AI Dubbing,这是一款先进的产品,可以将长篇语音内容翻译成20多种语言。该解决方案适用于所有平台用户,提供了一种新颖的方式来配音视频和音频内容,并改造了一直以手动方式为主的区域。

ElevenLabs的首席执行官兼联合创始人Mati Staniszewski表示,新功能是在数百名内容创作者的协助下开发和测试的。目标是使内容更容易为更广泛的受众所访问,特别是对于缺乏聘请翻译人员来全球化内容的独立创作者。

AI 配音的工作原理

在背景噪音消除和语音翻译等多层人工智能驱动任务下,人工智能配音是一个用户友好的工具。用户只需在ElevenLabs上选择AI配音工具,创建一个新项目,确定源语言和目标语言,然后上传内容文件。上传后,该工具将识别扬声器的数量并开始转换过程,该过程由屏幕上的进度条跟踪。文件完全处理后,可以下载并使用。

该工具采用ElevenLabs的专有算法来消除背景噪音并准确区分对话,音乐和其他声音。它还保持了原始说话者声音的完整性,有效地捕捉了他们的情感,并确保翻译语音的适当时机。

基于人工智能的声音即将出现

虽然ElevenLabs的发展越来越受到关注,但包括OpenAI和WellSaid Labs在内的其他科技公司也在探索基于AI的语音合成。一些公司,如Spotify,已经在应用这项技术,允许播客将他们的内容转录成不同的语言,同时保留他们的原始声音。

尽管竞争激烈,但Staniszewski对ElevenLabs的AI配音工具的能力充满信心。该工具通过翻译来自任意数量说话者的长篇音频或视频内容的能力,以多达 20 种语言保存他们的声音和情感,并提供高质量的结果,从而使自己与众不同。

根据Market US的数据,1年此类工具的全球市场价值为2亿美元,预计到2022年将达到近5亿美元,年增长率超过2032.15%。

使用 AI 生成有声读物

ElevenLabs正在成为音频AI工具的主要贡献者。9月,该公司推出了一种生成有声读物的AI解决方案。被称为项目,基于人工智能的工具旨在简化有声读物等长篇音频的生成和编辑。它基于该公司对长格式语音合成、音频调理和并行音频生成的研究。

该公司推出了支持2种语言的语音AI。十一多语言v<>是一个支持多种语言的模型,标志着AI语音生成和克隆的重大飞跃。该平台的用户可以在这种不同的语言范围内无缝使用ElevenLabs著名的文本转语音和语音克隆工具。

早在六月份,ElevenLabs的AI语音分类器就已经推出。这是一种首创的验证机制,允许用户上传任何音频样本,以确定它是否包含人工智能生成的音频。ElevenLabs指出,在处理一个音频样本时,AI语音分类器的准确率高达99%。

正文完