Meta推出SceneScript AI视觉模型,实时预测建立3D场景

人工智能 2024-03-25 22:12 阅读:22

Meta公司近日发布了一则官方新闻稿,宣布他们开发了一款名为“SceneScript”的视觉模型,这款模型号称可以利用可编程语言来快速建立场景,实时推断房间的几何形状,并将相关数据转换为建筑学层面的近似值。据称,这种方法能够高效且轻量地建立室内3D模型,只需要数KB的内存即可生成清晰且完整的几何形状,而且这些形状数据具有可解释性,用户可以轻松阅读和编辑这些数据表示。

开发人员在开发SceneScript时借鉴了大语言模型“预测单词”的方法,以Llama模型为例,该模型可以根据前面的单词来预测句子的下一个单词。类似地,SceneScript也运用了相同的概念,通过前序输入内容推出后文,并利用这些建筑学层面的描述来重建出复杂的室内3D环境。这种方法使得用户可以实时预测建立3D场景,为建筑学领域带来了全新的可能性。

Meta公司推出的SceneScript AI视觉模型为建筑学领域带来了革命性的变革,利用可编程语言实时预测建立3D场景,为用户提供了更加高效和便捷的建模工具,相信这一技术将在未来得到更广泛的应用和发展。