Stability AI Launches AI Audio Platform Using Diffusion Model to Generate Custom Songs and Audio

主题：Stability AI推出文本转音频生成AI平台

要点：

Stability AI推出了名为Stable Audio的文本转音频生成AI平台。
Stable Audio使用扩散模型进行训练，该模型是该公司更受欢迎的图像平台Stable Diffusion的AI模型，但以音频而非图像进行训练。
用户可以使用Stable Audio为任何项目生成歌曲或背景音频。
音频扩散模型往往会生成固定长度的音频，这对于音乐制作来说是糟糕的，因为歌曲的长度可能不同。Stability AI的新平台允许用户在不同长度上产生声音，需要在歌曲的开始和结束时间周围添加文本元数据。
公司通过合作许可公司AudioSparx的文本元数据中的数据集进行训练，该数据集包含超过800,000个音频文件和19,500小时的声音。
Stable Audio将有三个定价层次：免费版，每月可创建20个曲目的45秒音频；专业版，价格为11.99美元，可创建500个长达90秒的曲目；企业订阅版，公司可以根据自己的使用情况和价格进行定制。
Stability AI计划扩展到音频生成、视频和3D图像领域。