类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
6
-
浏览
53538
-
获赞
43
热门推荐
-
msmin全国实体店(miumiu中国官网旗舰店)
msmin全国实体店(miumiu中国官网旗舰店)来源:时尚服装网阅读:3509有哪些适合二十多岁女生的服装品牌?我个人推荐迪赛尼斯,每件衣服都很有让你买的欲望,真的很好看,而且很适合出去穿。 国产女巴彦淖尔机场公安分局全力保障您安全出行
本网讯巴彦淖尔机场:李欣彤报道)近日,巴彦淖尔机场公安分局按照市防控指挥部下发的《关于进一步加强巴彦淖尔机场复航后社会管控工作的通知》要求,全力配合机场及地方卫健委保障做好复航后的保障工作。机场公安分山东空管分局工程建设指挥部严格执行“三重一大”制度
中国民用航空网通讯员张颢绢报道:4月2日,工程建设指挥部党支部召开支部委员会议,认真贯彻落实“三重一大”决策制度,坚持做到重要事项决策、重要人员变动、重要工作安排、资金使用,经支部集体讨论方可做出决定广西空管分局顺利完成华泰自动化系统线上培训
为认真贯彻落实民航局空管局“防疫不松懈,业务不停训”的工作要求,确保疫情防控与培训教育两不误,着力做好一线技术人员复工复产培训工作,夯实“三基”建设。近日,广西空管分局技术保障部组织终端设备管理室全Opening Ceremony x Hoka One One 联名 Clifton 3 跑鞋公布
潮牌汇 / 潮流资讯 / Opening Ceremony x Hoka One One 联名 Clifton 3 跑鞋公布2020年02月23日浏览:6027 虽然知火山喷发竟造就中国恐龙时代的“庞贝城”
中国东北地区热河生物群发现一处考古遗址,完好保存着大量白垩纪早期动物尸体化石,图A是鹦鹉龙化石,图B和C是类似乌鸦的始祖鸟。科学家认为造成大量生物死亡的原因是火山喷发。英国每日邮报报道,目前,科学家发消防物流联合演练 绷紧安全这根弦
目前,全球疫情形势持续蔓延,广州白云机场作为国家空地南大门承担了较多国际救援物资的中转任务,因此,确保物资在转运过程中的安全就显得尤为重要。 4月7日,为了进一步提高白云机场物流的消防安全处置能呼伦贝尔空管站开展夜间运行整治工作
(通讯员:陈霄)呼伦贝尔空管站为贯彻落实《关于加强空管夜间运行管理工作的通知》和《关于进一步加强空管夜间运行管理工作的通知》文件要求,针对空管系统近期发生的管制员夜间脱岗、迟到岗事件,防范夜间运行的风辽宁:省市区12315部门三级联动 优化市场服务环境
中国消费者报沈阳讯(记者王文郁)9月9日,《中国消费者报》记者从辽宁省市场监管局了解到,辽宁省市场监管事务服务中心投诉举报中心近日会同沈阳市市场监管投诉举报中心、浑南区市场监管局召开专题座谈会议,就O秦陵兵马俑到底为谁而建?秦始皇还是秦宣太后
一九七四年三月,在陕西省临渔县秦始皇陵东侧,发现了大型的兵马俑坑。当它独特的雄姿一露出大地,就引起了国内外学者、专家的重视和兴趣。参观者蜂拥而至,有人称它为世界八大奇迹之一。毫无疑问,秦俑坑的发现,又呼伦贝尔空管站开展夜间运行整治工作
(通讯员:陈霄)呼伦贝尔空管站为贯彻落实《关于加强空管夜间运行管理工作的通知》和《关于进一步加强空管夜间运行管理工作的通知》文件要求,针对空管系统近期发生的管制员夜间脱岗、迟到岗事件,防范夜间运行的风星星点灯 用一点光温暖孩子的心—记大连空管站“微爱童行”走过的路
通讯员徐卓、孙亮报道:星星很美,但却总是在遥远的夜空中孤独的闪烁,可望而不可及。有这样一群孩子,他们也像星星一样,孤独的活在自己的星球里,他们在沟通交流方面似乎有着自己独特的方式,无法与人正常沟通交流施耐德电气:共建微网新业态,共赢绿色新质力
伴随全球能源结构的深刻变革,智慧、绿色、灵活的微电网技术正成为构建新型电力系统、推动能源转型的关键力量。11月14日,2024施耐德电气微电网主题沙龙在厦门成功举办。在活动现场,施耐德电气携手众多行业天津空管分局气象台积极落实“两会”网络安全保卫工作
通信员 王颖)4月7日,天津空管分局气象台机务室严格落实“两会”网络安全保卫工作的任务要求。采用两手抓,完成气象网络信息安全的隐患排查、治理工作以及专项应急演练工作。消除安全运行风险,为“两会”期点亮武汉 深圳空管站保障武汉第一批恢复客运航班
马可、林海洋、郑阳)4月8日7点56分,伴随着发动机的轰鸣声,深航9127航班在深圳宝安机场滑跑起飞,这是78天以来从深圳飞往武汉的第一架次客运航班。珠三角也是武汉出行的热门地点,4月8日全天,武汉往