跳到主要内容

音频的生命周期

音频的生命周期

音频的生命周期指的是,一段音频从创建到生成、合并、扩展等各种过程。下面演示音频的相关处理流程。

备注

我们将生成的音频称之为切片, 或者clip。

音频生成任务提交

音频生成有两种方法, 对应官网的两种模式(custom 的打开或者关闭)

两种方法对应了两套参数,但是是同一个 API 端点,都是使用 generate/v2 来完成。

具体请参考下面的提交生成任务的文档。

调用任意一个端点,将会提交音频生成任务。 1 次生成任务,返回 2 个音频 id。

备注

如果歌词中包含人名、色情等各类敏感词汇,则非常容易导致生成失败。生成的音频中,也会将疑似人名的地方变声处理,使其发音不准。

如果正常生成,则在返回的 json 数据中会有一个数组,每个元素都包含了歌曲的 id,后续可以通过这个 id 对歌曲进行继续生成或者是查询结果等操作。

生成结果查询

根据提交任务返回的 song_id 来进行查询,具体请参考对应的文档。

其中 status 可能的值有 submitted, queued, streaming, complete, error。

备注

一旦状态为 streaming,也就意味着歌曲已经可以播放了。此时距离提交音频生成任务可能只过去了十几秒。 此时的 audio_url字段的值格式是这样的 https://audiopipe.suno.ai/?item_id={song_id}。

完整生成音频需要 2 分钟甚至更多。

此时 status为 complete, audio_url的值大概是这个格式 https://cdn1.suno.ai/{song_id}.mp3。

音频的扩展

此时已经完整了音频的一部分生成,单次生成最长为 4 分钟。可以通过 /gateway/generate/v2 接口来继续生成第 2 段音频。还可以利用第二段音频的 song_id 来生成第 3 段音频,甚至更多音频。

音频的合并

每次调用 /gateway/generate/v2 接口都只能生成 2段最长为 4 分钟的音频,如果需要合并多段音频,可以通过调用 /gateway/generate/concat 接口来将多段音频合并为1段音频。