NVIDIA发布LATTE3D:文本秒变3D形状

2024年03月22日 由 daydream 发表 56 0

NVIDIA的研究人员发布了LATTE3D,这是一种新型模型,能够在毫秒内将文本提示转化为高质量的3D形状。这种快速的生成速度尤其令人印象深刻,可以大大简化创作过程。例如,它可以让设计师快速迭代脑海中的想法,而不是从头开始或搜索资产库。


微信截图_20240322130847


NVIDIA人工智能研究副总裁Sanja Fidler表示:“一年前,AI模型需要一个小时才能生成这种质量的3D视觉效果——而目前的顶尖技术也需要大约10到12秒。我们现在可以产生比过去快一个数量级的结果,使创作者能够接近实时地将文本转化为3D图形,从而满足各行各业的需求。”


该模型会为每个文本提示生成多个3D形状选项,为创作者提供一系列选择。选定的对象可以在几分钟内进行优化,以提高质量,并导出到各种图形软件应用程序或平台,如NVIDIA Omniverse。


虽然研究人员专门针对动物和日常物品的数据集训练了LATTE3D,但该模型架构可以适应各种其他数据类型进行训练。例如,训练于3D植物的版本可以帮助景观设计师快速填充花园渲染图,而训练于家用物品的版本可以生成用于训练个人助理机器人的3D家庭模拟物品。


LATTE3D的训练涉及NVIDIA A100 Tensor Core GPU和使用ChatGPT生成的多样化文本提示。这种方法提高了模型处理用户可能以多种方式描述3D对象的能力。


论文中详细介绍的进一步研究表明,该模型还具有其他优势,例如通过3D先验、形状正则化和模型初始化来增强鲁棒性。涉及体积和基于表面的渲染的两阶段管道允许快速生成具有详细纹理的网格。


借助LATTE3D,NVIDIA正在推动生成式AI的边界,使其更快、更易于各行业创作者将他们的想法以3D形式呈现出来。随着技术的不断发展,我们可以期待看到更多创新的应用和用例出现。 

文章来源:https://www.maginative.com/article/nvidias-latte3d-can-generate-3d-from-text-prompts-in-seconds/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消