Z-Image-Controlnet - 支持姿势、深度、边缘控制的文生图神器 支持50系显卡 ComfyUI工作流 一键整合包下载
Z-Image(造相)是阿里巴巴通义实验室最新开源的一个强大且高效的图像生成模型,凭借轻量参数实现重量级模型的视觉质量,支持中英双语渲染并在消费级显卡上实现秒级出图。
今天分享的 Z-Image-Controlnet 使用的是最新开源的 Z-Image-Turbo 文生图模型,集成了最新的Controlnet-Union,支持多种控制条件,如 边缘控制、全局边缘控制、深度控制、姿态控制和 直线检测控制等生成图像。
Z-Image包括三款模型:
Z-Image-Turbo:已开源!速度王者!在专业显卡上1秒内出图,家用显卡(8G显存)也能流畅运行。擅长生成照片级真实图像,中英文文字渲染精准,能准确理解用户指令。
Z-Image-Base:即将开源!基础全能版,开放给开发者自由定制训练。
Z-Image-Edit:即将开源!修图大师!根据文字指令智能修改图片,比如把“沙滩换成雪山”这种复杂操作。
应用场景
广告设计:输入“国风少女手持发光灯笼站在古城墙前”,直接生成宣传海报
文创设计:自动生成含中英文的logo/包装设计(如茶叶罐上的“茶π”字样)
智能修图:对照片进行自然语言修改,比如“把阴天改成晚霞”
内容创作:自媒体配图、电商商品场景图快速生成
使用教程:(建议N卡,显存8G起,支持50系显卡)
ComfyUI工作流:整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。
双击启动,进入WebUI后,点击左侧的 工作流程,选择对应的工作流
进入工作流后,上传参考图,选择控制类型(AIO辅助预处理器下节点下的preprocessor选择,常用的边缘控制 CannyEdgePreprocessor,姿势控制 DWPreprocessor,深度控制 DepthAnythingV2Preprocessor 等),
输入提示词,设置生成分辨率(AIO辅助预处理器节点下的resolution,比如512,1024等),Controlnet 强度(数值越大,越接近参考图,建议0.65-0.8,可根据需要增加),最后运行即可。
Lora模型下载后放到ComfyUI\models\loras目录下,工作流中切换即可
这里科普下ControlNet,之前很多新手咨询过
ControlNet 是一个扩展,它能让图像生成模型在生成时“受控”,按照某些结构或特征来生成图像。不同的预处理器就是不同的“控制方式”,相当于给模型一张“草稿”或“骨架”,让它照着画。
Canny(边缘检测)
就像用铅笔把图像的轮廓线勾出来。模型会根据这些线条生成图像,适合保留物体的形状和结构。举例:你给一张房子的线稿,它就能生成一张真实的房子图。
HED(Holistically-Nested Edge Detection,全局边缘检测)
比 Canny 更智能的“描边”,能抓住更细腻的轮廓和边缘。适合需要更精细的线条控制,比如人物的五官、复杂的背景。举例:画漫画时,HED 能帮你提取更干净的线稿。
Depth(深度图)
就像告诉模型“前面近,后面远”。用灰度图表示物体的远近关系,帮助生成有空间感的画面。举例:一张山景的深度图能让模型生成有层次感的风景。
Pose(人体姿态)
给模型一张“火柴人骨架”,它就能照着摆姿势生成完整人物。常用于人物生成,确保动作和姿势准确。举例:你画一个举手的火柴人,它就能生成一个举手的美女。
MLSD(直线检测,Line Segment Detection)
专门用来提取直线结构,比如建筑、房间、家具。模型会根据这些直线生成规整的空间或物体。举例:你给一张房间的线框图,它就能生成真实的室内效果图。
软件目录结构:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_3_4b.safetensors
│ ├── 📂 diffusion_models/
│ │ └── z-image-turbo-fp8-e4m3fn.safetensors
│ └── 📂 model_patches/
│ └── Z-Image-Turbo-Fun-Controlnet-Union-fp8-e5m2.safetensors
📂 deepface/
......
下载地址:
主程序:https://pan.quark.cn/s/81a1b15d8c57
模型:https://pan.quark.cn/s/773419a858d8
confyui字太多太複雜老頭子眼睛不行 用得很累 哈哈 !推推推 不過 還是給您加油 讚 试用了,很不错 帅哥,下载文件跑不了
用不了啊!
感谢分享,下载GGUf模型就可以了,谢谢!
求图片放大、图片提示词反推工作流及模型分享! 太强大了,谢谢
页:
[1]