Stability AI Launches AI Audio Platform Using Diffusion Model to Generate Custom Songs and Audio
主题:Stability AI推出文本转音频生成AI平台
要点:
- Stability AI推出了名为Stable Audio的文本转音频生成AI平台。
- Stable Audio使用扩散模型进行训练,该模型是该公司更受欢迎的图像平台Stable Diffusion的AI模型,但以音频而非图像进行训练。
- 用户可以使用Stable Audio为任何项目生成歌曲或背景音频。
- 音频扩散模型往往会生成固定长度的音频,这对于音乐制作来说是糟糕的,因为歌曲的长度可能不同。Stability AI的新平台允许用户在不同长度上产生声音,需要在歌曲的开始和结束时间周围添加文本元数据。
- 公司通过合作许可公司AudioSparx的文本元数据中的数据集进行训练,该数据集包含超过800,000个音频文件和19,500小时的声音。
- Stable Audio将有三个定价层次:免费版,每月可创建20个曲目的45秒音频;专业版,价格为11.99美元,可创建500个长达90秒的曲目;企业订阅版,公司可以根据自己的使用情况和价格进行定制。
- Stability AI计划扩展到音频生成、视频和3D图像领域。