NVIDIA发布LATTE3D：文本秒变3D形状

2024年03月22日由 daydream 发表 538 0

NVIDIA的研究人员发布了LATTE3D，这是一种新型模型，能够在毫秒内将文本提示转化为高质量的3D形状。这种快速的生成速度尤其令人印象深刻，可以大大简化创作过程。例如，它可以让设计师快速迭代脑海中的想法，而不是从头开始或搜索资产库。

微信截图_20240322130847

NVIDIA人工智能研究副总裁Sanja Fidler表示：“一年前，AI模型需要一个小时才能生成这种质量的3D视觉效果——而目前的顶尖技术也需要大约10到12秒。我们现在可以产生比过去快一个数量级的结果，使创作者能够接近实时地将文本转化为3D图形，从而满足各行各业的需求。”

该模型会为每个文本提示生成多个3D形状选项，为创作者提供一系列选择。选定的对象可以在几分钟内进行优化，以提高质量，并导出到各种图形软件应用程序或平台，如NVIDIA Omniverse。

虽然研究人员专门针对动物和日常物品的数据集训练了LATTE3D，但该模型架构可以适应各种其他数据类型进行训练。例如，训练于3D植物的版本可以帮助景观设计师快速填充花园渲染图，而训练于家用物品的版本可以生成用于训练个人助理机器人的3D家庭模拟物品。

LATTE3D的训练涉及NVIDIA A100 Tensor Core GPU和使用ChatGPT生成的多样化文本提示。这种方法提高了模型处理用户可能以多种方式描述3D对象的能力。

论文中详细介绍的进一步研究表明，该模型还具有其他优势，例如通过3D先验、形状正则化和模型初始化来增强鲁棒性。涉及体积和基于表面的渲染的两阶段管道允许快速生成具有详细纹理的网格。

借助LATTE3D，NVIDIA正在推动生成式AI的边界，使其更快、更易于各行业创作者将他们的想法以3D形式呈现出来。随着技术的不断发展，我们可以期待看到更多创新的应用和用例出现。

文章来源：https://www.maginative.com/article/nvidias-latte3d-can-generate-3d-from-text-prompts-in-seconds/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇苹果开发多模态LLM，实现图像数据解读

下一篇 AI新突破：单步扩散模型实现快速图像生成

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市