音频的生命周期

音频的生命周期指的是，一段音频从创建到生成、合并、扩展等各种过程。下面演示音频的相关处理流程。

备注

我们将生成的音频称之为切片，或者clip。

音频生成有两种方法，对应官网的两种模式（custom 的打开或者关闭）

两种方法对应了两套参数，但是是同一个 API 端点，都是使用 generate/v2 来完成。

具体请参考下面的提交生成任务的文档。

调用任意一个端点，将会提交音频生成任务。 1 次生成任务，返回 2 个音频 id。

备注

如果歌词中包含人名、色情等各类敏感词汇，则非常容易导致生成失败。生成的音频中，也会将疑似人名的地方变声处理，使其发音不准。

如果正常生成，则在返回的 json 数据中会有一个数组，每个元素都包含了歌曲的 id，后续可以通过这个 id 对歌曲进行继续生成或者是查询结果等操作。

根据提交任务返回的 song_id 来进行查询，具体请参考对应的文档。

其中 status 可能的值有 submitted, queued, streaming, complete, error。

备注

一旦状态为 streaming，也就意味着歌曲已经可以播放了。此时距离提交音频生成任务可能只过去了十几秒。此时的 audio_url字段的值格式是这样的 https://audiopipe.suno.ai/?item_id={song_id}。

完整生成音频需要 2 分钟甚至更多。

此时 status为 complete, audio_url的值大概是这个格式 https://cdn1.suno.ai/{song_id}.mp3。

此时已经完整了音频的一部分生成，单次生成最长为 4 分钟。可以通过 /gateway/generate/v2 接口来继续生成第 2 段音频。还可以利用第二段音频的 song_id 来生成第 3 段音频，甚至更多音频。

每次调用 /gateway/generate/v2 接口都只能生成 2段最长为 4 分钟的音频，如果需要合并多段音频，可以通过调用 /gateway/generate/concat 接口来将多段音频合并为1段音频。