找回密码
 立即注册
查看: 315|回复: 0

3D虚拟试穿来了!港大和西北工业提出GaussianVTON,通过多阶段高斯溅射编辑与2D VTON

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-5-29 15:48:37 | 显示全部楼层 |阅读模式
GaussianVTON实现高效的人类环境通过重构和编辑在试戴应用程序中进行交互多视点图像。方法首次使用了图像提示实现更精确和定制的3D高斯泼洒编辑。

与现有的依赖文本提示的作品不同。对于3D编辑,例如GaussianEditor,GaussianVTON避免了错误地替换服装并影响服装的其他区域,以及导致背景和面部特征等其他元素的变化。

此外,与文本驱动相比3D服装人体生成或重建工作如HumanGaussian,GaussianVTON是基于真实的人体图像,避免导致奇怪的体型,并符合提示。








摘要
电子商务的日益流行凸显了虚拟试穿 (VTON) 的重要性。然而,以前的研究主要集中在 2D 领域,并且严重依赖大量数据进行训练。3D VTON 的研究主要集中在服装与体形的兼容性上,这是 2D VTON 中广泛涵盖的一个主题。得益于 3D 场景编辑的进步,2D 扩散模型现已通过多视点编辑适应 3D 编辑。

在这项工作中,我们提出了 GaussianVTON,这是一种创新的 3D VTON 管道,将高斯溅射 (GS) 编辑与 2D VTON 相结合。为了促进从 2D 到 3D VTON 的无缝过渡,我们首次提出仅使用图像作为 3D 编辑的编辑提示。为了进一步解决编辑过程中面部模糊、服装不准确和视点质量下降等问题,我们设计了一个三阶段细化策略来逐步缓解潜在问题。此外,我们引入了一种称为“编辑调用重建 (ERR)”的新编辑策略,以解决以前的编辑策略在导致复杂几何变化方面的局限性。

我们的全面实验证明了 GaussianVTON 的优越性,为 3D VTON 提供了新颖的视角,同时也为图像提示的 3D 场景编辑建立了一个新颖的起点。


项目地址:https://github.com/HaroldChen19/GaussianVTON


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 22:42 , Processed in 0.073596 second(s), 3 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表