logo
15
4
WeChat Login
Forkfromai-models/tencent/SongGeneration, aheadmain29 commits

Tencent SongGenertion Comfyui 快速开始

ComfyUI Version Python Version Torch Version CUDA Version

使用方式

  • fork 本仓库
  • 在 TERMINAL 中执行 sh start-comfyui.sh 启动 comfyui
  • 菜单中按快捷键 'w' , 选择工作流. 运行即可开始生成,大约要几分钟。生成完成后,在页面收听结果
  • 生成结果在 ComfyUI/output/ 目录下, 可右键下载到本地。

生成结果展示

您的浏览器不支持 FLAC 播放。音频文件见 assets/results/song_audios03111858.flac

使用说明:

  • 在原版插件基础上,调整了歌词格式,注释中有说明。否则容易出现唱错字现象 (加了自动格式化到模型匹配格式的代码):
    • 不同段落用空行分割
    • 歌词用换行分割
  • 两种生成方式跑了都可以:提示词(prompt text)方式和提示音乐风格(prompt audio)方式
  • description 写法参考项目文档

其他

  • 使用 pytorch 源码,重新构建了 python 3.10 + torch 2.6 + cuda12.4 版本镜像,与 cnb gpu H20 机器的驱动兼容 (部分依赖库与 python 3.11 不兼容, 原因是 dataclass 升级造成默认值不能直接再使用 class 类型)

  • 镜像构建命令见 build-portorch-devel.sh 和 命令 docker build -t docker.cnb.cool/examples/ecosystem/ai-devel/tencent-song-generation-comfyui:v0.3.43-cu12.4-torch2.6 .

  • 理论上下载本仓库,配合镜像也可以本地运行。注意下显卡驱动 NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0

致谢及参考文档

操作演示视频:

About

No description, topics, or website provided.
Language
Python77%
Dockerfile15%
Shell8%