谷歌发布SoundStorm：高效的并行音频生成

谷歌发布SoundStorm：高效的并行音频生成

近年来，生成式人工智能的进展使得在文本、视觉和音频等多个领域中创造新内容成为可能。这些模型通常依赖于将原始数据首先转换为一系列标记的压缩格式。在音频方面，神经音频编解码器可以将波形有效地压缩为紧凑的表示形式，这可以被反转以重构原始音频信号的近似值。通过将音频表示为一系列离散的标记，可以使用基于Transformer的序列到序列模型进行音频生成。与AutoLM等许多生成音频模型不同，SoundStorm能够并行生成标记，从而将推理时间减少了100倍，并产生了相同质量的音频和更高的语音和声学条件一致性。

谷歌发布SoundStorm：高效的并行音频生成

正文完

发表至：系统工具

2023-06-27

0

Pi Network先锋内转名额推荐的操作方法，Pi Network教程说明

XIU主题8.1更新日志：新增头像服务器自定义和几个备选、重写侧栏随动

如何在 Notepad++ 中用换行符替换任何字符

Epic Games Store 终于有成就了

微软将Bing作为默认搜索选项引入ChatGPT

推荐两款禁止Win 10 更新的工具

O＆O Lanytix：快速了解Windows上的局域网设备

朱雀仿宋 – 首款开源仿宋字体

Open AI更新：包括16k上下文3.5 模型等

Hasleo Backup Suite Free，这是一款全新的 Windows 备份软件

如何在 Facebook Messenger 上使用“秘密对话”

Dr. Dre 将在新故事 DLC 中登陆 GTA 在线模式

首先看一下WhatsApp的“查看一次”媒体功能

如何在 Twitter 上删除转推

任务栏声音徽章将音频指示器添加到Windows任务栏图标

240Hz 显示器值得吗？

Inflection-1：Pi 背后的基础语言模型

RLHF的实际工作原理以及我们何时能在开源项目中看到它

文章搜索