类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
8
-
浏览
6872
-
获赞
36986
热门推荐
-
分析师:黄金中期上涨趋势已被破坏,需要时间重燃涨势
汇通财经APP讯——黄金今年表现出色,创下每盎司2790美元的历史新高,从2月份的低点上涨了40%以上,但一位分析师表示,中期上涨趋势已被破坏,宏观经济因素可能需要一段时间才能重新点燃黄金的涨势。OA喀什管理公司召开外委业务安全服务专题会
通讯员:范浩)7月7日,喀什管理公司召开外委业务安全服务专题会,管理公司领导、各外委单位及归口主管部门参加了本次会议。会议传达学习了《关于开展外委业务专项自查的通知》安全工作通知单-2023-57)《历史上商纣王为什么会被封神?
纣王叫什么名字纣王,也称商纣王,我国古代商朝时期第三十二位君主,名字为受,姓氏为子。后世称他为“帝辛”。他一生约活了六十五载,在商朝的首都朝歌被攻克后,商纣王殷受自焚而死。商朝的最后一位皇帝,这个暴虐16岁就为曹操献计,17岁被曹操杀之,实力堪比诸葛亮
一提起三国时期的人物,大多数人联想到的可能是诸葛亮的神机妙算、曹操的奸诈、刘备的仁义、张飞的鲁莽、周瑜的心胸狭窄等等。但是今天我们说的这位他只有17岁,17岁就被曹操下令杀害,他就是神童周不疑!周不疑记者:国足2丢球都与防线调整有关 李铁选人问题已暴露
记者:国足2丢球都与防线调整有关 李铁选人问题已暴露_王刚www.ty42.com 日期:2021-10-08 09:31:00| 评论(已有305865条评论)东航新开加密多条杭甬始发国内、国际航线服务暑运高峰
今年暑运是“乙类乙管”后的第一个暑运,随着中高考结束、高校陆续放假、旅游度假、探亲访友、商务出行等需求集中释放。7月起,东航加密杭州往返吉隆坡航线至每天1班,加密宁波往返山航空保支队党委副书记李峰赴七大队开展送清凉活动
炎炎夏日、骄阳似火暑运生产旺季进行的如火如荼为切实做好主题调研工作解决基层实际困难进一步落实“我为群众办实事”活动部署7月18日支队党委副书记、纪委书记李峰带领相关业务骨干赴七贵州空管分局培训中心顺利完成AirNetSim程序管制模拟机现场评估
2023年7月初,受民航局空管办委托,民航西南地区管理局组织地区空管局、民航院校和研究机构等单位组成的评估专家组,对贵州空管分局AirNetSim程序管制模拟机)进行了现场技术评估。在分局综合业务部、优衣库 UT 全新 THE BRANDS MASTER PIECE 系列首波单品公布
潮牌汇 / 潮流资讯 / 优衣库 UT 全新 THE BRANDS MASTER PIECE 系列首波单品公布2020年02月20日浏览:3558 每一季 UNIQLO秦朝焚书坑儒为什么没有毁灭文化?
焚书坑儒的原因秦始皇统一中国后,有过“焚书坑儒”的举措,长久以来,人们对这件事情似乎没有一个正解。都只是看到了它不利的一面却没看见它的好处,事实上,它也有一定的积极作用。“焚书坑儒”塑像关于“焚书坑儒喀什机场成功举办机坪长理论知识竞赛
通讯员:孙建华)为了推动喀什机场安全管理工作,了解机坪长各项作业情况,喀什机场举办机坪长理论知识竞赛。此次机坪长理论知识竞赛旨在提高机坪长的专业素养和安全意识,确保机坪上的作业流程更加规范和安全。宁夏空管分局塔台管制室完善应急检查单,提升保障能力
根据民航局对管制应急处置的重要批示,为进一步做好管制岗位应急处置工作,优化特情处置流程,规范应急处置检查单,确保运行安全,塔台管制室近日组织专人对塔台的应急保障程序进行重新梳理,完善应急检查单,波切蒂诺:我们考虑在安菲尔德赢球,不想成为利物浦庆祝的一部分
1月30日讯 北京时间2月1日凌晨4:15,2023-24赛季英超联赛第22轮,切尔西将在客场挑战利物浦。赛前,切尔西主帅波切蒂诺出席了新闻发布会,他谈到了球队目前的一些情况。关于球队伤病情况——古斯东航新开加密多条杭甬始发国内、国际航线服务暑运高峰
今年暑运是“乙类乙管”后的第一个暑运,随着中高考结束、高校陆续放假、旅游度假、探亲访友、商务出行等需求集中释放。7月起,东航加密杭州往返吉隆坡航线至每天1班,加密宁波往返夏桀是暴君吗?最后是因为宠爱妹喜亡国的吗?
暴君夏桀夏桀是夏朝最后一位君主,因为他残暴不堪,断送了夏朝政权。夏朝百姓们,常年生活在夏桀的残酷压榨之下,对夏桀恨之入骨。百姓编唱了一首歌曲,反映出了夏桀的残暴和百姓的水深火热。歌曲这样唱到:“江水沛