类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
986
-
浏览
97
-
获赞
29365
热门推荐
-
绮籽品牌简介(绮籽女装官网)
绮籽品牌简介(绮籽女装官网)来源:时尚服装网阅读:5808绮籽的读音拼音:qǐ 简体部首:纟五笔:XDSK总笔画:11笔顺编码:フフ一一ノ丶一,フ一, 解释:有文彩的丝织品:~罗。纨~。~襦纨绔。绮籽支付宝又出黑科技,停车场不停车通过
雷锋网6月20日消息,据中新网报道,上海虹桥停车场和支付宝推出升级版无现金智慧停车场,用户出入不需要停车刷卡,即可通过。停车场摄像头在识别车牌后,会自动从车主的支付宝里扣除停车费,车辆通行时间预计只需本泽马:又我背锅吉达联合目前非常混乱集合剩5天没主帅没新援
07月07日讯 据罗马诺以及沙特媒体的报道,吉达联合目前内部非常混乱,导致原本已经达成协议的皮奥利以及比利时国脚泰特交易已经停滞。截止目前,吉达联合仍未得知今夏所分配的转会预算数额,在与皮奥利的谈判暂Air Force 1 全新“SNKRS Day”限定鞋款即将登场
潮牌汇 / 潮流资讯 / Air Force 1 全新“SNKRS Day”限定鞋款即将登场2022年06月21日浏览:2408 除去各种 40 周年的纪念款式外,日前边路爆点⚡22岁奥利斯2传1射助队取胜,10轮6球3助身价5000万欧
01月31日讯 英超第22轮,水晶宫3-2战胜谢菲尔德联,此役水晶宫边锋奥利斯表现出色,2传1射帮助球队取得胜利。 奥利斯远射打入制胜球本赛季奥利斯因伤错过了英超前11轮比赛,复出后奥利斯表现出色,代结束5年红军生涯!官方:利物浦37岁门将阿德里安离队,随队获7冠
07月08日讯 利物浦官方消息,37岁的门将阿德里安合同到期自由身离队。阿德里安现年37岁,2019年从西汉姆联免签加盟利物浦。各项赛事共代表利物浦出战26场比赛,贡献7次零封。阿德里安共随利物浦夺得VILLA D’ÉTÉ艾迪逊店中秋前夕绮丽启幕,南法⻛情浪漫悠然绽放于三亚
[三亚,9月16日,中秋前夜]特约记着:孟铁军 —— 在这个现代而又不失温馨的初秋时节,当明⽉渐圆,预示着团圆的佳节即将来临,高端海岛穿搭品牌VILLA D’ÉTÉ选择在这样一个充满期待的时刻,于艾迪外科学系召开2013级外科研究生/住院医师入训培训会
2013年9月29日下午16:00,外科学系在第二住院大楼四楼外科会议室召开了2013级外科研究生/住院医师入训培训会。会上,外科学系分管住院医师管理的胆道外科叶辉主任向2013级外科研究生/住院医师GROUNDY 2020 春夏系列 Lookbook 释出,无性别设计
潮牌汇 / 潮流资讯 / GROUNDY 2020 春夏系列 Lookbook 释出,无性别设计2020年02月25日浏览:2871 山本耀司的子品牌 GROUNDY继Vans x 《怪奇物语4》全新联名 Old Skool 鞋款来袭
潮牌汇 / 潮流资讯 / Vans x 《怪奇物语4》全新联名 Old Skool 鞋款来袭2022年06月23日浏览:3192 与 Brain Dead 的合作再一次护理部举办第一期品管圈活动推行总结会
9月26日下午16:00,护理部在临床教学楼三会议室举行了第一期品管圈活动推行总结会。会议由蒋艳副主任主持,全院护理品管圈圈长和部分护士长参加了本次会议。护理部共收到38份品管圈项目成果报告书,涉及医CPFM x Stüssy 2022 全新合作系列预告公布
潮牌汇 / 潮流资讯 / CPFM x Stüssy 2022 全新合作系列预告公布2022年06月23日浏览:2358 与耐克合作的 Dunk Low 鞋履之后,最近UFC巨星谈C罗:史上最佳 激励了数以百万计的人
UFC巨星谈C罗:史上最佳 激励了数以百万计的人_哈比布www.ty42.com 日期:2021-10-06 09:01:00| 评论(已有305583条评论)北京开展碳排放配额有偿竞价发放 成交量近35万吨
近日,依据《北京市碳排放权交易管理办法》,北京市生态环境局组织开展了本市2023年度碳排放配额有偿竞价发放工作,委托本市碳排放权交易机构北京绿色交易所具体实施,竞价程序于9月初完成。其间,共68家重点现货黄金短线交易策略:决战美联储议息会议!“黄昏之星”发出顶部信号,还需提防“靴子落地”?
汇通财经APP讯——周三9月18日)亚市早盘,现货黄金上行受阻后回落,目前交投于2573.80美元/盎司附近,尽管美元指数回吐隔夜部分涨幅,但黄金多头仍有所顾忌。一方面是,隔夜美国零售销售月率的数据强