无言以对 发表于 2026-5-11 19:30:45

HiDream-O1-Image - 像素级统一 AI 画师 一模型搞定文生图+图像编辑 一键整合包下载


HiDream-O1-Image 是智象未来开源的图像生成模型,它能直接处理像素和文字,不依赖额外的编码器,直接把原始像素、文字和各种控制条件放在同一个空间里处理,像一个“全能选手”。支持文本生成图像、图像编辑和个性化定制,最高分辨率可达 2048×2048。它特点是高效、通用,并且在多项评测中表现优异。




HiDream-O1-Image 对人像生成效果不太好,它更擅长海报制作、生成产品图片以及图文生成,大家可以根据自己的使用场景,选择合适的模型。如果是人像生成和编辑,推荐Z-Image-Turbo或者Flux2-Klein,如果是海报,图文,推荐HiDream-O1-Image。



主要特点

原生高分辨率:直接生成最高 2048×2048 的清晰图片,细节锐利。
一模型多任务:不仅能文生图,还支持图像编辑、主体个性化(比如固定某个角色或 IP 换场景)、故事板生成、长文字排版等。
内置“思考”代理:生成前有个小 Agent 先帮你理清提示词、布局和文字渲染,减少“听不懂”或乱排版的问题。
效率高:只有 8B 参数,却在多个基准测试中打败很多更大模型,尤其在复杂构图、文字渲染、多语言排版上表现突出。



应用领域

创意设计:海报、插画、宣传图、产品渲染。
内容创作:动漫、故事板、社交媒体图片、长文字海报。
个性化生成:角色一致性、IP 形象、电商商品图。
专业领域:建筑效果图、游戏素材、电影概念图等需要精准控制的场景。



使用教程:(建议N卡,显存8G起,支持50系显卡)

整合包包含所需所有节点,下载主程序压缩包和模型(ComfyUI文件夹即为模型),解压主程序压缩包,然后将ComfyUI文件夹移动到主程序目录下即可。

WebUI:启动WebUI,包含文生图和图像编辑
文生图 - 输入提示词,设置生成图像宽和高,生成即可。
图像编辑 - 上传需要编辑的图像(支持3张图像编辑),输入提示词,设置生成图像宽和高,生成即可。
支持自定义切换模型,前端支持在线下载,切换需要使用的模型,勾选自动下载即可。

ComfyUI工作流:整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。
双击启动,进入WebUI后,点击左侧的 工作流程,选择对应的工作流

文生图 - 输入提示词,设置生成图像宽和高,生成即可。
图像编辑 - 上传需要编辑的图像(支持3张图像编辑),输入提示词,设置生成图像宽和高,生成即可。

支持自定义切换模型,HiDream O1 Model Loader节点下的“downloa_if_missing”开启,切换需要使用的模型,即可自动下载。


下载完整模型文件夹,并放入 ComfyUI/models/diffusion_models/:

模型版本显存参考下载链接
Full BF16~18-20 GBdrbaph/HiDream-O1-Image-BF16
Full FP16~18-20 GBdrbaph/HiDream-O1-Image-FP16
Full FP8~10-11 GBdrbaph/HiDream-O1-Image-FP8
Dev BF16~18-20 GBdrbaph/HiDream-O1-Image-Dev-BF16
Dev FP16~18-20 GBdrbaph/HiDream-O1-Image-Dev-FP16
Dev FP8~10-11 GBdrbaph/HiDream-O1-Image-Dev-FP8




参数默认值说明
model_typeauto如果模型文件夹名包含 dev,自动使用 Dev 配方,否则使用 Full 配方
width2048请求输出宽度;内部会对齐到支持的 patch 分辨率
height2048请求输出高度;内部会对齐到支持的 patch 分辨率
steps00 表示自动:Full 为 50 步;Dev 始终使用上游固定 28 步时间表
seed42随机种子
guidance_scale5.0Full 模式 CFG 强度;Dev 模式忽略此项并使用 0.0
shift-1.0-1 表示自动:Full 为 3.0,Dev 为 1.0
noise_scale_start7.5初始噪声缩放
noise_scale_end7.5最终噪声缩放
noise_clip_std2.5噪声裁剪标准差
preview_every4每 N 步发送一次解码预览;0 禁用预览
keep_image1_aspectfalse仅在连接 image_1 时生效
force_offloadfalse生成完成后立即卸载模型
image0动态参考图数量,范围 0 到 12


实测:8G显存显卡 rtx3070/rtx4060/rtx5060均可运行,运存需要≥32G


软件目录结构

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │      └──📂 HiDream-O1-Image-DEV-fp8/
│   │             └── model.safetensors
📂 deepface/
......




下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOsOQ7l48PcjmsfITmOuX8RIA1?pwd=pw6k

夸克网盘:
**** 本内容需购买 ****

百度网盘:
**** 本内容需购买 ****

yersamdy 发表于 2026-5-12 10:07:20

模型达到~18-20 GB就已经能劝退不少玩家了。感谢分享。

无言以对 发表于 2026-5-12 10:28:51

yersamdy 发表于 2026-5-12 10:07
模型达到~18-20 GB就已经能劝退不少玩家了。感谢分享。
那是 BF16
FP8只需要8G显存
页: [1]
查看完整版本: HiDream-O1-Image - 像素级统一 AI 画师 一模型搞定文生图+图像编辑 一键整合包下载