无言以对 发表于 2026-1-6 21:56:31

Kandinsky 5 - 轻量文/图生视频 低配设备福音 6G显存可用 支持50系显卡 ComfyUI工作流 一键整合包


Kandinsky 5.0 是一个开源的 AI 多模态模型家族,可以根据文字或图片生成高质量的图像和视频。它的特点是支持多种模式(文字生成视频、图片生成视频、文字生成图片、图片编辑),并且在速度、质量和硬件适配上做了优化,适合研究人员、创作者和开发者使用。

今天分享的一键包基于 Kandinsky 5.0 Lite轻量模型,支持最低6G显存运行文/图生视频,低配显卡的福音。这是个多模态家族模型,同时支持图像生成和图像编辑,今天分享的一键包只支持视频生成,且使用的是轻量版模型,总体效果非常不错,比同类Wan系列的GGUF要好,但缺点也是有的,就是没有加速lora,需要50步,速度略慢。



核心特点

多模态生成:既能从文字生成视频(Text-to-Video, T2V),也能从图片生成视频(Image-to-Video, I2V),还支持文字生成图片(T2I)和图片编辑(I2I)。
高质量视频:Video Pro 模型可生成 5–10 秒的高清视频,并能控制镜头运动。
轻量化版本:Video Lite 模型参数更少(2B),速度快、显存需求低,适合普通 GPU。
图像生成与编辑:Image Lite 和 Image Editing 模型支持 1K 分辨率,能生成或修改高质量图片。
优化推理性能:支持 Flash Attention、SDPA 等多种注意力机制,能在 12GB 显存的显卡上运行。




应用领域

创意内容制作:广告、短视频、动画分镜,快速生成视觉素材。
游戏与虚拟世界:生成角色动作、场景视频或概念图。
教育与科研:研究扩散模型、视频生成算法,或作为教学演示工具。
社交媒体与营销:快速产出有创意的图片和短视频,提高传播效率。
影视与设计:辅助导演、设计师进行视觉预览和风格探索。




使用教程:(建议N卡,显存6G起,支持50系显卡)

整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。

双击启动ComfyUI,进入页面,点击左侧工作流,加载工作流。
支持文生视频和图生视频,进入对应的工作流,输入提示词/上传图像输入提示词,设置宽高等参数,运行即可。




下载地址:
https://pan.quark.cn/s/99d6833bb14a
页: [1]
查看完整版本: Kandinsky 5 - 轻量文/图生视频 低配设备福音 6G显存可用 支持50系显卡 ComfyUI工作流 一键整合包