ElevenLabs推出创新的多语言翻译AI配音功能

由谷歌和Palantir前员工创立的初创公司ElevenLabs最近宣布推出AI Dubbing，这是一款先进的产品，可以将长篇语音内容翻译成20多种语言。该解决方案适用于所有平台用户，提供了一种新颖的方式来配音视频和音频内容，并改造了一直以手动方式为主的区域。

ElevenLabs的首席执行官兼联合创始人Mati Staniszewski表示，新功能是在数百名内容创作者的协助下开发和测试的。目标是使内容更容易为更广泛的受众所访问，特别是对于缺乏聘请翻译人员来全球化内容的独立创作者。

AI 配音的工作原理

在背景噪音消除和语音翻译等多层人工智能驱动任务下，人工智能配音是一个用户友好的工具。用户只需在ElevenLabs上选择AI配音工具，创建一个新项目，确定源语言和目标语言，然后上传内容文件。上传后，该工具将识别扬声器的数量并开始转换过程，该过程由屏幕上的进度条跟踪。文件完全处理后，可以下载并使用。

该工具采用ElevenLabs的专有算法来消除背景噪音并准确区分对话，音乐和其他声音。它还保持了原始说话者声音的完整性，有效地捕捉了他们的情感，并确保翻译语音的适当时机。

虽然ElevenLabs的发展越来越受到关注，但包括OpenAI和WellSaid Labs在内的其他科技公司也在探索基于AI的语音合成。一些公司，如Spotify，已经在应用这项技术，允许播客将他们的内容转录成不同的语言，同时保留他们的原始声音。

尽管竞争激烈，但Staniszewski对ElevenLabs的AI配音工具的能力充满信心。该工具通过翻译来自任意数量说话者的长篇音频或视频内容的能力，以多达 20 种语言保存他们的声音和情感，并提供高质量的结果，从而使自己与众不同。

根据Market US的数据，1年此类工具的全球市场价值为2亿美元，预计到2022年将达到近5亿美元，年增长率超过2032.15%。

ElevenLabs正在成为音频AI工具的主要贡献者。9月，该公司推出了一种生成有声读物的AI解决方案。被称为项目，基于人工智能的工具旨在简化有声读物等长篇音频的生成和编辑。它基于该公司对长格式语音合成、音频调理和并行音频生成的研究。

该公司推出了支持2种语言的语音AI。十一多语言v<>是一个支持多种语言的模型，标志着AI语音生成和克隆的重大飞跃。该平台的用户可以在这种不同的语言范围内无缝使用ElevenLabs著名的文本转语音和语音克隆工具。

早在六月份，ElevenLabs的AI语音分类器就已经推出。这是一种首创的验证机制，允许用户上传任何音频样本，以确定它是否包含人工智能生成的音频。ElevenLabs指出，在处理一个音频样本时，AI语音分类器的准确率高达99%。

正文完

发表至：技术教程

2023-10-13

0

Microsoft 通过将语法引入全球租户来增强多地理位置配置系统