基于SevenLabs语音引擎,将人声合成扩展到歌唱领域。支持中文、英文、日文等多种语言的AI歌唱合成,控制音高、力度、颤音、气声等演唱技巧。
从风格标签或参考旋律出发,AI生成完整的编曲。支持流行、电子、古典、国风、爵士等多种风格,可控制曲式结构、和声进行、配器组合。
根据主题、情绪、韵脚要求生成中文歌词。支持流行、古风、民谣、说唱等体裁,可指定段落结构(主歌/副歌/桥段),自动押韵与节奏匹配。
以下为计划中的Demo方向——实际音频将在模型部署后上线
原创中文流行歌曲
古诗词谱曲吟唱
全器乐AI编曲
情绪驱动的即兴创作
对比 ACE-O、DiffSinger、VISinger2 等开源歌唱合成模型在中文上的表现,选择最适基座。
将 SevenLabs 7种AI人格扩展到歌唱领域,实现"说话的声音也会唱歌"。
部署开源音乐生成模型(Meta MusicGen / Stability Stable Audio),实现文字到音乐的生成。
基于大语言模型 + 中文韵脚库 + 格律规则引擎,实现结构化歌词生成。