类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
542
-
浏览
92
-
获赞
5
热门推荐
-
美元飙升给全球市场带来压力,涨势能否延续?
汇通财经APP讯——受美联储不愿降息的提振,美元继续飙升。美元强势给股市和全球经济带来了严峻的挑战。美元的攀升是一种可持续的优势,还是会给市场带来风险?鲍威尔为何保持利率不变?美联储主席鲍威尔最近重申北宋六贼是哪六个人?北宋六贼之首是蔡京?
“北宋六贼”是民间对北宋年间六个奸臣的合称,这六个人分别是蔡京、王黼、童贯、梁师成、朱勔、李邦彦,基本都是宋徽宗时期重要的大臣,这六个人贪赃枉法、横行霸道,弄得民不聊生,是导致当时江南方腊起义和金国入山西空管分局与山西省无线电管理局开展业务交流
通讯员 刘立宏)2020年6月10日,受山西省无线电管理局邀请,山西空管分局派无线电管理人员刘立宏、管制教员王权、技术保障部高工姜斌三位同志,以授课交流方式参加了山西省无管局举办的“为提高山西省各地市秦始皇统一六国 为什么我们不叫秦族而叫汉族?
原谅小侯的不正经,接下来小侯就该一本正经的胡说八道了。众所周知,秦始皇统一了六国,建立了中国历史上第一个中央集权的大一统王朝 —— 秦朝。在秦朝建立之前的历史时期是战国,那时候虽然是分裂的,但是我们的lancyfrom25服装旗舰店(lanz服装)
lancyfrom25服装旗舰店(lanz服装)来源:时尚服装网阅读:2233郎姿丽女装是品牌吗朗姿女装是二线品牌,属于中端档次。朗姿女装品牌主要的各种服饰以高雅的职业女装及富有时代韵味的精美时装为主诸葛亮没用“子午奇计”:是对是错?
魏延是一位足智多谋,骁勇善战的军事奇才,却受到诸葛亮的质疑和压抑。后来诸葛亮也没有采纳魏延所提的“子午奇计”,这一举措对蜀汉的政局来讲到底是对还是错呢?网络配图建兴六年公元228年),第一次北伐,魏延内蒙古:内蒙古空管分局技术保障部积极开展安全生产月活动
本网讯通讯员 兰妮)“消除事故隐患,筑牢安全防线”作为2020年“安全生产月”活动的主题,为深入贯彻民航局关于加强安全生产工作的重要指示精神。6月1日,技术保障部结合2020年华北空管局工作计划,组织内蒙古空管分局终端设备室党支部召开党员民主评议大会
本网讯通讯员 侯海坤)为进一步在终端设备室党支部实行有效的民主监督,加强廉政建设,提高党员素质,发挥党员的先锋模范作用,在群众中树立党员的良好形象。近日,内蒙古空管分局终端设备室党支部组织开展党员民主scat女装怎么没有了(scat女装官方旗舰店)
scat女装怎么没有了(scat女装官方旗舰店)来源:时尚服装网阅读:2343好的女装品牌有哪些?1、华伦天奴Valentino)是全球高级定制和高级成衣最顶级的奢侈品品牌之一,以高贵的女装、晚礼服最揭秘康熙帝荣妃:清代生育子女最多的皇妃
在清代两百多年的历史中,为皇家生育子女最多的后妃共有三人,她们都为皇家生育了六个孩子。三人中,除一位皇太后、一位皇后外,还有一位妃子。她不是别人,正是深受康熙帝宠爱的荣妃。在我国的历代王朝中,一个后妃揭秘卫青死后汉武帝刘彻为何急于对卫家动手?
元封五年(前106年),大将军卫青病逝,谥号为烈侯。在上古文献中“烈”是光亮、煊赫,有雄伟、浩荡之意。以此表扬了卫青战功卓著、不平凡的人生之旅。卫青对卫氏家属,甚至太子(卫青的外甥)的运气都有着严重影汕头空管站母线槽工程顺利接入UPS电源
6月11日凌晨5:30分,汕头空管站技术保障部雷达导航设备管理室顺利完成了母线槽工程接入UPS电源工作。 汕头空管站航管楼综合机房共有5台STS设备,为大机房内所有通导设备、监控大厅监控中粮集团全资收购来宝农业
12月22日,中粮集团与来宝集团达成一致协议,中粮集团旗下的中粮国际有限公司以下简称“中粮国际”)以7.5亿美元收购来宝集团所持有的中粮来宝农业49%的股权。此项交易完成后,中关羽真正死因却是因为自己的坐骑:赤兔马
一代战神,至今仍是黑帮心中的武圣关羽,真正死因如何?没错,关公死于赤兔马的年迈!马在5—10岁期间适合作为战马使用。过了这个年龄段就没有什么速度和爆发力可言了。而赤兔马从公元189年首次出现,到公元2此女子带兵打仗无所不能 却被夫君休了3次!
自古女子大多倡导温婉贤淑,做个站在男人身后默默支持的贤妻良母。虽然古代的思想束缚了女性的天性,但是历史上还是出现很多巾帼不让须眉的女子,其中最著名的大约是花木兰、穆桂英、梁红玉以及樊梨花。但是经过历史