6 月 7 日消息,Stability AI 依托 Stable Diffusion 模型,成功扩展到音频领域,推出Stable Audio Open,该K AI 开源模型仅需用户输入提示词,即可生成高品质的音频样本。
Stable Audio Open 能够生成最长 47 秒的音乐,适用于鼓点、乐器旋律、环境音及拟声等音效制作。这款开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中精细操作,从而提升生成音频的质量和多样性。
本文链接:http://www.xihao.site/news1268.htmlStable Audio Open 发布开源 AI 模型