人工智能研究实验室OpenAI公布了其最新技术的详细信息,这些技术将对3D渲染进行巨大改进。OpenAI是文本到图像生成器DALL-E背后的公司,该公
人工智能研究实验室OpenAI公布了其最新技术的详细信息,这些技术将对3D渲染进行巨大改进。OpenAI是文本到图像生成器DALL-E背后的公司,该公司现在已将注意力转向将文本提示转换为3D点云,并将其称为POINT-E。
根据一篇论文(在新标签页中打开)POINT-E由OpenAI发布,“在单个GPU上仅需1-2分钟即可生成3D模型”,而当前的其他解决方案可能需要数小时并需要多个GPU。
该论文的摘录详细介绍了POINT-E在3D模型构建领域的当前地位:
“虽然我们的方法在样本质量方面仍未达到最先进的水平,但它的采样速度要快一到两个数量级,为某些用例提供了实际的权衡。”
它通过使用文本到图像扩散模型生成单个合成视图来工作。然后,生成一个3D点云,它更容易合成,因此减少了GPU的负载,尽管它不捕获更小的细节,因此论文中提到的权衡。
已经训练了一个二级人工智能来缓解其中的一些问题,但这项工作解释说,这可能“有时会错过物体的薄/稀疏部分”,比如植物的茎,给人一种漂浮的花朵的错觉。
OpenAI承诺已经在数百万个3D模型及其元数据上训练了人工智能,尽管目前它的用例仍然相当有限。
一个这样的例子包括为3D打印渲染真实世界的对象,尽管随着技术的发展和变得更加完善,我们很可能会看到它被用于更高级的情况,例如游戏甚至电视。
声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们