类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
31375
-
浏览
64
-
获赞
65
热门推荐
-
carven和之禾哪个高档(之禾什么品牌)
carven和之禾哪个高档(之禾什么品牌)来源:时尚服装网阅读:3091谁是凶手沈雨穿的风衣牌子?1、谁是凶手风衣品牌是Dior。谁是凶手,剧情越看越上头,全员演技在线,但最吸引我的还是颖宝的穿搭,知山东空管分局管制专业开展复盘工作
中国民用航空网通讯员亓广禄报道:为了进一步提升运行品质,强化安全责任落实,10月22日,山东空管分局管制运行部召开了塔台、进近以及总主任席位部分人员工作会议,就近期三个运行单位之间出现的问题进行了复盘山航工程技术公司组织召开波音航空运营成本研讨会
近日,为提升运行成本管控水平,助力公司实现增收节支目标,山航工程技术公司邀请波音公司和CFM公司专家来济召开航空运营成本研讨会。工程技术公司、飞行部、运行风险控制中心、股份财务部、投资与采购部、营销委三国英年早逝的六大谋略家:鬼才郭嘉第一
三国时期英才辈出,文臣如云,武将如雨,袁绍和曹操的争霸,刘备和孙权的争雄,归根结底是人才和资源的战争。其中有着无数的智者或谋士,推动着历史车轮的滚滚前进。然而有一些谋略级人物,却天妒英才,英年早逝,不GROUNDY 2020 春夏系列 Lookbook 释出,无性别设计
潮牌汇 / 潮流资讯 / GROUNDY 2020 春夏系列 Lookbook 释出,无性别设计2020年02月25日浏览:2871 山本耀司的子品牌 GROUNDY继呼和浩特机场消防大队开展秋季体能训练活动
通讯员:呼和浩特机场白力为提升呼和浩特机场消防战斗员体能素质,更好的处置应急救援任务,近日,呼和浩特机场航空安全保卫部消防监护廊桥特勤支队消防大队组织开展秋季体能训练活动。此次体能训练内容是根据《民用汉宣帝比汉武帝文治武功还牛?为何这么说
汉武帝是中国历史上最出名的皇帝之一,他在位期间派军数次大破匈奴,匈奴正是在他的打击下再也没有恢复往日的辉煌,同时也是在汉武帝在位时期,朝鲜半岛并入我大汉国土,南方的疆域也有所扩展,如今越南的大部分地区黄山机场候机楼新商业区增设吊顶项目通过竣工验收
10月10日,黄山机场分公司综保部组织候管部、企管部、财务部等部门代表以及设计、施工、监理等参建方代表对黄山机场候机楼二层新商业区增设吊顶项目进行竣工验收。验收小组通过实地检查和查阅工程资料等方式进行foeeifoeeie手表价格(foeeifoeeie手表价格查询)
foeeifoeeie手表价格(foeeifoeeie手表价格查询)来源:时尚服装网阅读:21549foeeifoeeie什么牌子Folli Follie (芙丽芙丽) 是一个源自希腊雅典的时尚品牌,青海空管分局气象台设备室完成秋季外场设备换季维护工作
中国民用航空网通讯网马伊清讯:金秋十月,碧空如洗。机坪上的野花随风摇摆,默默祝福着秋的收获。季节更替,树叶落地,这是收获的时节,也是气象外场设备换季维护和气象设备人员思想换季的时节。为确保此次换季工作贵州空管分局积极保障应急航班
不忘初心,牢记使命,全情保障区域内每一架航空器能安全、顺畅运行,是贵州空管分局区域管制室每一位管制员的首要使命。而就在2019年10月18日的下午15时18分,区域管制员接到重庆区域管制室打来协调电话民航珠海空管站团委开展“我与祖国共奋进——国旗下的演讲”特别主题团日活动
为庆祝中华人民共和国成立70周年,积极响应共青团中央要求,珠海空管站团委于2019年10月17日组织全站团员青年前往“珠海市党性党史教育基地”、“广东省红色革命遗址项目”——珠海市桂山岛“桂山”号英雄分析师:黄金中期上涨趋势已被破坏,需要时间重燃涨势
汇通财经APP讯——黄金今年表现出色,创下每盎司2790美元的历史新高,从2月份的低点上涨了40%以上,但一位分析师表示,中期上涨趋势已被破坏,宏观经济因素可能需要一段时间才能重新点燃黄金的涨势。OA山航工程技术公司召开2019年度第2次重点项目调度会
近日,山航工程技术公司召开2019年度第2次重点项目调度会,各维修基地以视频连线的形式参加。工程技术公司党委书记杨士坤、副总经理蔺维明出席会议并讲话。各部门负责人、重点项目组长、项目管理员参加会议。会贵州空管分局积极保障应急航班
不忘初心,牢记使命,全情保障区域内每一架航空器能安全、顺畅运行,是贵州空管分局区域管制室每一位管制员的首要使命。而就在2019年10月18日的下午15时18分,区域管制员接到重庆区域管制室打来协调电话