Sana - 比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型 本地一键整合包下载 ... ... ... ... . ...
Sana 是英伟达与麻省理工学院、清华大学的研究人员合作开发的全新文本到图像生成框架,该框架能够高效生成高达4096×4096分辨率的图像。
Sana 可以在极快的速度下合成高分辨率、高质量且与文本高度一致的图像,甚至可以在笔记本电脑的GPU上运行。 Sana-0.6B 在性能上与大型扩散模型(如 Flux-12B)不相上下,但模型规模却小20倍,速度快100多倍。 此外,Sana-0.6B 可以部署在16GB 的笔记本电脑 GPU 上,生成1024×1024分辨率的图像只需不到1秒钟,Sana 使低成本的内容创作成为可能。
Sana 的主要优势在于其高效性。 在4K 图像生成方面,Sana-0.6B 的吞吐量比目前最先进的方法 (FLUX) 快100多倍,在1K 分辨率下快40倍。Sana采用了深度压缩自编码器和线性扩散变换器,提升了生成速度和质量,并支持多种语言提示,方便用户创作。
研究人员还对 Sana-0.6B 进行了量化,并将其部署在边缘设备上。在配备 RTX-4090GPU 的消费级设备上,生成1024×1024分辨率的图像只需0.37秒,为实时图像生成提供了强大的基础模型。
今天分享的WebUI是基于Sana-1.6B模型,最大支持2048*2048高分辨率图像生成,且支持批量生成。
项目地址:https://github.com/NVlabs/Sana
使用教程:(建议N卡,显存12G起)
输入提示词(支持中文),设置参数,生成即可。
支持批量生成,为每次生成设置不同的提示词和参数,添加到队列,最后生成队列即可。
下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOGnHhmqeYCfX4cEygU1hlp6A1?pwd=rhm5
夸克网盘:游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源 立即购买
百度网盘:游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源 立即购买
解压密码:https://deepface.cc/
|