类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
938
-
浏览
46
-
获赞
88
热门推荐
-
Supreme X 奥利奥联名包装谍照释出,有点诱人呀!
潮牌汇 / 潮流资讯 / Supreme X 奥利奥联名包装谍照释出,有点诱人呀!2020年02月19日浏览:7121 美潮 Supreme本季带来与奥利奥联名包装可是刑诉法修订:那些亟待填补的空白
8月30日,《刑事诉讼法修正案(草案)》及草案说明在中国人大网全文公布,并向社会公开征集意见。草案共99条,涉及证据制度、强制措施、辩护制度、侦查措施、审判程序、执行规定和特别程序等七大方面。客观地说美国正面临更为严重的结构性危机
美国货币和财政刺激效力已达极限,经济衰退、国债与GDP之比的上升不可避免,而全球性危机注定将周而复始。比债务违约更可怕的是美国经济再次衰退风险的急剧上升,在2008年以来的两轮货币和财政刺激措施过后,辽朝的铁骑在当时那么厉害,为什么不直接将大宋灭掉?
如今提起大辽相信大家都不会太过于陌生,但是这个辽国在大家的心里应该还是有那么一些疑惑的,而最大的一个疑惑应该就是大辽为什么没有直接把大宋灭了,而是一直保持着一个相对和平的状态呢?下面趣历史小编就为大家朗曼笛女装羽绒服图片大全(朗曼笛女装是几线品牌)
朗曼笛女装羽绒服图片大全(朗曼笛女装是几线品牌)来源:时尚服装网阅读:4631朗曼笛和埃文是几线品牌埃文羽绒服是二线品牌,虽然是二线品牌,但是它的做工远远不亚于一线品牌的服装,金羽杰属于轻奢档次。雅鹿银行近半利润来自手续费的背后
N舒圣祥最近,已有12家上市银行公布2011年上半年业绩。报告显示,12家银行上半年共实现净利润4244.47亿元,其中手续费及佣金净收入2057.43亿元,几乎占净利润的半壁江山。12家银行的手续费大太监刘瑾的权力是哪个皇帝给的?最后他的结局如何?
刘瑾本姓谈,陕西兴平人,自幼入宫,投靠在一个姓刘的太监门下,因此冒姓刘,在东宫太子朱厚照身边做玩件。朱厚照即位后,刘瑾利用和皇帝一起游玩的感情得明武宗宠信,把持朝政。他的所作所为与前朝的王振相比更加无日本新首相的“不能承受之轻”
8月29日,经过执政民主党众参两院议员大会投票,前财务相野田佳彦战胜经产相海江田万里、前外相前原诚司等4名候选人,当选新的民主党代表,并将于30日在菅内阁宣布总辞职后,成为日本第95任首相。野田本人在国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分
国足胜越南摆脱小组垫底尴尬 国际足联排名拿到10.35积分_中国队www.ty42.com 日期:2021-10-08 22:01:00| 评论(已有305959条评论)扶老人恐惧症才是社会真正的悲哀
“扶老人恐惧症”在全社会正呈燎原之势,卫生部却在此时发布《老年人跌倒干预技术指南》,提出老人跌倒不要急于扶起,要分情况进行处理。指南甫一出台就引来口水无数,不少人认为该指南的出台是因为频发的“扶老人做“读书无用论”根子在“权力通吃”
N吴龙贵人民日报近日刊文称,“读书改变命运”正受到现实的挑战。报道列举了陕西一户农民家庭:老大黄艳宁大学毕业后的求职历程辛酸而曲折;老二黄柯柯的北大求学历程,崎岖而幸运;老三黄磊放弃高考学技术挣钱,现明朝这位皇后到底有多幸福?皇帝竟在后宫独宠她一人
中国封建社会时期,有权有势的男人大都妻妾无数,尤其是皇帝,一般来说,就算没有三宫六院,也会是妃嫔无数。但在中国历史上,偏偏就有这么一位皇帝,从始至终都只娶了一个女人,大臣们多次上奏劝其纳妃延续皇嗣,但浙江温岭:开展中秋节前月饼专项检查
中秋佳节临近,为使广大消费者过上祥和中秋节,浙江省温岭市市场监管局开展月饼专项检查,及时消除食品安全隐患,确保群众吃上安全放心的月饼。9月13日,温岭市市场监管局执法人员对台州市壹兜麦香食品有限公司等马皇后到底有什么能力?只要还活着就能防止朱棣造反?
孝慈高皇后马氏是明太祖朱元璋的结发妻子,滁阳王郭子兴的养女。马皇后贤良淑德识大体,她与朱元璋患难与共感情极深,成为朱元璋逐鹿天下创建帝业的重要助手。马皇后病逝于洪武十五年(1382年),寿享51岁,我经历了土木堡之变的明英宗,是受到了太监王振的怂恿吗?
所谓的“土木之变”,就是我们常说的“土木堡之变”,又或称为“土木之祸”,此次大变对于明朝来说,不仅仅是蒙羞的问题,毕竟皇帝成了俘虏实在不怎么光彩,最大的问题在于,它直接导致了明朝自此之后开始由盛转衰,