Fork 本仓库到自己名下。之后有两种启动方式:
sh start-cnb-demo.sh 启动后台服务启动完成约2分钟,然后浏览器打开页面即可。服务部署在公网,手机默认浏览器也能访问,CNB 的 URL 格式如:https://***.cnb.run/
选择 Omni Full-Duplex 全模态全双工模式。打开摄像头和麦克风,体验能看、能听、能说的智能体。(使用手机实时边拍边聊,使用体验效果不错。手机要横屏过来能点到 Start 按钮)
其他几种模式也可用,如无摄像头时,可以体验“语音全双工”模式实时语音对话。细节使用方式参考文档
可以边用边思考下适用的使用场景,科技向善。更多功能特性也是参考结尾使用文档链接
501e65e (源码我改了一行参数,见git历史)minicpm-o-4_5-pytorch-simple-demo | 系统程序源码 models | 模型权重文件 config.json | 应用的配置文件,copy自 config.example.json start-cnb-demo.sh | cnb 适配的启动脚本 .cnb* | cnb 平台的配置文件 env-build | 构建运行镜像使用的脚本工具,方便自己构建环境
config.json中的 "compile": true, 配置,加速配置测试也能跑通。注意编译启动会慢点,第一次对话回复要多等几分钟,预热完就好了。 cnb.yml 中配置了缓存目录方便复用(目前 cnb 有3台左右开发节点机器,每台新机器跑过一次后,就有模型编译缓存了)docker.cnb.cool/tian-yu/ai/minicpm-o-4_5-pytorch-simple-demo:latest 作为docker容器环境,指定GPU并将仓库挂载到 /workspace 目录启动。(镜像理论上能兼容,也可参考 build-pytorch-devel.sh 和 Dockerfile 构建自己镜像)