无言以对 发表于 2025-10-24 12:17:07

Ditto - 基于指令的视频编辑框架,会打字就能轻松编辑视频 支持50系显卡 WebUI+ComfyUI工作流 一键整合包下载


Ditto 是一个专注于‌指令式视频编辑‌的AI框架,简单来说就是让用户通过文字指令(比如“把视频里的蓝天换成星空”,“将视频转换成日本动画风格”)就能自动完成视频编辑或风格转换。
Ditto 在指令跟随能力和视频质量上都达到了新的行业标杆,特别在保持时间连贯性方面表现突出,让编辑后的视频不会出现闪烁或跳跃现象。


应用领域‌‌

创意视频制作‌:普通用户通过文字指令快速实现专业级视频特效 ‌
影视后期‌:简化视频修改流程,如替换背景、调整风格等 ‌
教育科普‌:快速生成教学演示视频 ‌
广告营销‌:高效制作多版本广告视频 ‌
社交媒体‌:为短视频平台提供一键式视频美化



使用教程:(建议N卡,显存10G起,支持50系显卡,建议CUDA≥12.8)

整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。

ComfyUI模式:
双击启动ComfyUI,进入WebUI后,点击左侧的 工作流程,选择工作流,上传需要编辑的视频,输入编辑提示词。设置对应参数,比如宽度和高度,帧数等生成即可。
实测10G显存可以运行,速度略慢,建议12G 显存起。默认开启sage_attention 加速,如遇到报错,将 WanVideo Model Loader 节点里的 attention_mode 切换成 sdpa 。

WebUI模式:
双击启动Webui,上传需要编辑的视频,输入提示词,参数可以根据需要设置,提交生成即可。
生成时长默认是3秒(24x3+1=73秒),可以自由调整生成帧数,建议不要太长,否则会造成爆显存或生成视频不稳定,建议5秒左右。
默认开启sage_attention 加速,如遇到报错,将 Attention 模式 切换成 sdpa .


注. 开启 sage_attention 加速需要本地安装VC编译环境,具体安装教程参考 此贴



下载地址:
UC网盘:https://drive.uc.cn/s/eab541f3b2bc4

夸克网盘:**** 本内容需购买 ****
页: [1]
查看完整版本: Ditto - 基于指令的视频编辑框架,会打字就能轻松编辑视频 支持50系显卡 WebUI+ComfyUI工作流 一键整合包下载