Sana - 比FLUX快100倍!英伟达联手MIT、清华开源超快AI图像生成模型 本地一键整合包下载
Sana 是英伟达与麻省理工学院、清华大学的研究人员合作开发的全新文本到图像生成框架,该框架能够高效生成高达4096×4096分辨率的图像。
Sana 可以在极快的速度下合成高分辨率、高质量且与文本高度一致的图像,甚至可以在笔记本电脑的GPU上运行。 Sana-0.6B 在性能上与大型扩散模型(如 Flux-12B)不相上下,但模型规模却小20倍,速度快100多倍。 此外,Sana-0.6B 可以部署在16GB 的笔记本电脑 GPU 上,生成1024×1024分辨率的图像只需不到1秒钟,Sana 使低成本的内容创作成为可能。
Sana 的主要优势在于其高效性。 在4K 图像生成方面,Sana-0.6B 的吞吐量比目前最先进的方法 (FLUX) 快100多倍,在1K 分辨率下快40倍。Sana采用了深度压缩自编码器和线性扩散变换器,提升了生成速度和质量,并支持多种语言提示,方便用户创作。
研究人员还对 Sana-0.6B 进行了量化,并将其部署在边缘设备上。在配备 RTX-4090GPU 的消费级设备上,生成1024×1024分辨率的图像只需0.37秒,为实时图像生成提供了强大的基础模型。
今天分享的WebUI是基于Sana-1.6B模型,最大支持2048*2048高分辨率图像生成,且支持批量生成。
项目地址:https://github.com/NVlabs/Sana
使用教程:(建议N卡,显存12G起)
输入提示词(支持中文),设置参数,生成即可。
支持批量生成,为每次生成设置不同的提示词和参数,添加到队列,最后生成队列即可。
下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOGnHhmqeYCfX4cEygU1hlp6A1?pwd=rhm5
夸克网盘:**** 本内容需购买 ****
百度网盘:**** 本内容需购买 ****
解压密码:https://deepface.cc/
操作简单,小白容易上手,效果也不差,就是硬件要求太高了。 来日方长 发表于 2025-1-23 13:56
操作简单,小白容易上手,效果也不差,就是硬件要求太高了。
现在人手4090的时代了;P 现在人手4090 只有咬咬牙换显卡了:'(:'(:'( Traceback (most recent call last):
File "<frozen __main__>", line 3, in <module>
File "<frozen app>", line 5, in <module>
File "C:\Users\Administrator\Desktop\Sana\deepface\lib\site-packages\torch\__init__.py", line 148, in <module>
raise err
OSError: 找不到指定的模块。 Error loading "C:\Users\Administrator\Desktop\Sana\deepface\lib\site-packages\torch\lib\fbgemm.dll" or one of its dependencies.
请按任意键继续. . .
盟主,这个是怎么回事呢? zizhang 发表于 2025-1-25 02:07
Traceback (most recent call last):
File "", line 3, in
File "", line 5, in
新人必看里找,以后出了问题先看新人必看,张嘴就问的伸手党,不再回复
https://deepface.cc/thread-302-1-1.html
无言以对 发表于 2025-1-25 10:44
新人必看里找,以后出了问题先看新人必看,张嘴就问的伸手党,不再回复
https://deepface.cc/thread-302-1 ...
感谢盟主。
页:
[1]