[XM官网]苹果发布 LiTo 大模型:单图生成 3D 对象,AI 高度还原多视角光影

2026-03-17 15:16:57
该专利描述名为LiTo(表面光场标记化)的最新模型,打破了传统方法需要多角度图像输入的限制,在重建3D对象之后,用户切换不同观察视角后,该模型生成的反光、高光等光影效果依然能保持高度的物理真实与一致性。这项突破的核心在于对创新应用“潜在空间”(LatentSpace)。在机器学习中,潜在空间能将复杂信息压缩成多维数学向量,从而大幅降低计算成本。LiTo模型首创了一种统一的3D潜在表示法,将随机采样的表面光场数据编码为紧凑的向量集。这意味着模型无需死记硬背每一个视觉细节,而是通过数学描述,同时掌握了对象的物理形状以及光线与其表面交互的底层规律。在具体运行机制上,LiTo编码器负责“压缩信息”,将输入图像中的几何结构和视角相关的外观特征,转化为潜在空间中的精简代码。随后,解码器执行“逆向解压”,利用这些底层代码完整还原出3D对象。这种双向机制让模型能够精准复现复杂光照条件下的镜面高光和菲涅尔反射等高级光影效果。为打造该模型,苹果研究人员使用了数千个在150个不同视角和3种光照条件下渲染的3D对象进行高强度训练。系统通过不断抽取小部分数据样本,训练解码器在不同光照和视角下还原完整对象。最终,模型具备了仅凭单张图片就能预测其三维潜在表示的能力。在苹果公布的官方对比测试中,LiTo在多视角光影还原度上显著超越了现有的TRELLIS模型。亚汇网附上参考地址广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,亚汇网所有文章均包含本声明。

风险提示

外汇交易涉及高风险,可能不适合所有投资者。杠杆交易可能导致快速亏损,请确保您完全理解相关风险。过往表现不代表未来结果。

本分析仅供参考,不构成投资建议。投资者应根据自身情况做出独立判断,并承担相应风险。