李飞飞团队再放大招!你的显卡能造宇宙了!

2025-10-22 07:36:08技术分享

还记得上个月李飞飞教授那个创业公司World Labs搞出来的“Marble”吗?一张图就能给你造个宏大3D世界,当时就觉得够科幻了。结果!这才几天啊,他们又甩出一个王炸——RTFM模型

 

一、算力平民化

这玩意儿牛在哪?首先,最炸裂的点:它能在单张H100显卡上跑起来! 你没听错,就一块顶级游戏显卡级别的GPU!这意味着昨天你还在为抢不到显卡发愁,今天却发现自己的旧电脑突然能当超级计算机用了。

普通开发者、小团队,未来都可能摸得着、玩得起这种能“凭空造世界”的技术了,想想就热血沸腾!

 

二、脑补式渲染引擎

RTFM具体是干啥的?简单来说,它是个“学习型渲染器”。传统3D游戏、电影特效怎么做?得先建复杂的3D模型,然后打光、算阴影、搞反射,最后渲染成2D画面给你看。人工设计的东西多,还贼吃算力。

RTFM路子就野得很! 它不看那些复杂的3D结构,它就盯着你给它的一张(或几张)2D图片看。比如你给它一张客厅照片,它就能生成从阳台角度看向客厅的画面,连玻璃反光、窗帘阴影都自然得不可思议。

这种「学习型渲染器」的聪明之处在于——它是一种端到端训练的自回归扩散 Transformer,通过大规模视频数据训练,自己“悟”出了3D空间、光影反射、物体材质的规律,有从业者调侃这是「脑补引擎」,确实贴切。

这背后其实印证了图灵奖得主Rich Sutton那个著名的“苦涩的教训”真正厉害的技术,往往是那些能随着算力提升而优雅扩展的简单方法。

 

三、稳定的平行宇宙

它还解决了世界模型的一个大难题——持久性。想象一下。RTFM通过给每一帧画面都“记住”它在3D空间里的位置和朝向(姿态),配合一个叫“上下文调度”的聪明机制,让这个世界真正能长久存在,无论离开多久,返回时场景始终如一。

 

这技术预示着未来游戏、影视、VR/AR、甚至电商展示、建筑设计等领域都可能迎来翻天覆地的变化。当创造世界的工具变得触手可及,会迸发出怎样的创意火花?想想就让人期待!体验地址:

https://rtfm.worldlabs.ai/

播客地址:https://www.worldlabs.ai/blog/rtfm

 

📌划重点

  1. 算力平民化: 单GPU运行顶级世界模型,技术门槛被击穿,创造力大爆发时代来临!
  2. 脑补成真: “学习型渲染器”从2D图直接脑补3D世界,省去传统建模渲染的繁琐步骤。
  3. 世界永存: 通过记录姿态和上下文调度,实现虚拟世界的真正“持久性”,体验更真实。

 

 

更多AI知识请前往脑洞大开AI实验室网站

https://www.ai360labs.com

 

 

 

快来加入吧