信达证券:世界模型赋能AI,自动驾驶与机器人有望突破瓶颈
创始人
2025-03-07 12:42:01
0

财中社3月7日电信达证券发布电子行业报告。

世界模型研究进展迅速,应用端机遇与挑战并存。长期以来,科学界一直渴望开发一个统一的模型,该模型可以复制其世界的基本动态,以追求通用人工智能(AGI)。世界模型尚无统一的定义,英伟达官网的定义为:“世界模型是理解现实世界动态(包括其物理和空间属性)的生成式AI模型。它们使用文本、图像、视频和运动等输入数据来生成视频。通过学习,它们能够理解现实世界环境的物理特性,从而对运动、应力以及感官数据中的空间关系等动态进行表示和预测。” Sora发布之后,世界模型获得了更为广泛的关注。从功能方面看,在许多用例中,Sora确实具备一定的理解和预测世界的能力,且其生成的视频在大部分时候也能有良好的一致性。但也有人认为Sora仅是像素层面的生成,这会导致一些无法解释的现象,这表明Sora并未理解物理世界。从技术架构看,Sora是一种基于扩散的视频生成模型。但是无论如何,Sora的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前景的途径。应用层面看,随着视觉生成模型和多模态大模型的进展,世界模型在自动驾驶领域受到了广泛的关注。使用基于扩散的视频生成模型作为世界模型可以部分解决信息丢失和建模效率低下的问题,近年来已有相关的研究在不断进行。机器人领域的应用也是主要方向之一,世界模型让机器人在现实中处理通用任务展示出巨大前景。传统的机器人关键组件会被建模,机器人在执行任务时无需理解世界。而当机器人被部署在新的场景中时,机器人可能会手足无措,因此,世界模型对物理世界的理解和预测能力是机器人智能化的关键利器,LLMs和世界模型被认为是实现通用人工智能(AGI)的可能途径之一,它们可以成为机器理解世界基本规律的起点。目前AI发展迅速,大模型正快速学习如何理解物理世界,世界模型也有望迎来快速迭代时期。在近期发布的大模型中,o3-mini可以模拟生成一个小球在四维超立方体内弹射的Python代码。而Grok3则可以模拟航天器任务,生成的3D动画准确描述了飞船、地球、太阳、火星的位置关系。这些成果有可能从底层催动世界模型的进展,让AI的智能化进入更高的水平。

众多厂商推出世界模型,相关领域已展开角逐。英伟达推出Cosmos,赋能机器人和自动驾驶开发者。Cosmos世界基础模型是一套用于物理感知视频生成的开放式扩散和自回归Transformer模型。这些模型已基于2000万小时的真实世界人类互动、环境、工业、机器人和驾驶数据,训练了9,000万亿个token。李飞飞创立World Labs,探索从2D到3D的路径。World Labs是一家空间智能AI公司,由在AI学术领域享有盛誉的李飞飞博士创立。World Labs致力于构建空间智能大型世界模型(LWM)来感知、生成3D世界并与之交互。其目标是将AI模型从像素的2D平面提升到完整的3D世界。World Labs仅创立了三个月,便吸引了英伟达、AMD等公司的融资,估值超过10亿美元。谷歌旗下DeepMind推出Genie2,性能强大用例广泛。Genie 2是一种自回归潜在扩散模型,在大型视频数据集上进行了训练。通过自动编码器后,视频中的潜在帧被传递到大型transformer动力学模型,该模型使用类似于大型语言模型使用的因果掩码进行训练。在推理时,Genie 2可以以自回归方式进行采样,逐帧执行单个作和过去的潜帧。谷歌使用无分类器的指导来提高可控性。在DeepMind官网上,Genie2的能力也非常强大。昆仑万维发布Matrix-Zero,国产模型紧追不舍。昆仑万维发布的Matrix-Zero世界模型包含两款子模型,其中,3D场景生成大模型支持将用户输入的图片转化为可自由探索的真实合理的3D场景。而可交互视频生成大模型,提供以用户输入为核心驱动的可交互空间智能视频生成方案,支持根据用户实时输入生成互动视频效果,具备更精准控制的action model。

投资建议:无论是北美还是国内,推理成本的降低及推理性能的迅速提升趋势非常显著。微软董事长Satya Nadella曾在法说会表示,每代硬件的性价比提高2倍以上,而由于软件优化,每代模型的性能提升10倍以上。DeepSeek卓越的性价比让人印象深刻,据Semianalysis观察,在GPT-4上同样有类似的趋势,即每过一年,算法改进和优化使得推理成本降低10倍,同时性能提升10倍。因此,认为,AI的发展目前正如火如荼地进行着,大模型不会满足于帮人类查找资料这样的小事,长期看它甚至具备改变部分行业运行逻辑的潜力。而当前伴随推理性能的提升和推理成本的降低,许多算力密集型的场景有了落地的可能,本文所探讨的世界模型便是其中一个例子。世界模型可以帮助端侧理解并预测世界,从而产生正确的决策。从云来看,由于多模态数据的训练与推理,算力需求总体仍然呈现迅速增长的趋势;而从端来看,人形机器人、自动驾驶等重要赛道有望迅速前进,以突破目前的智能化瓶颈。AI呈现出巨大的产业前景,建议关注相关产业链优质个股。

相关内容

热门资讯

法拉第未来完成首款EAI机器人... 上证报中国证券网讯(记者 俞立严)1月26日,在纳斯达克上市的法拉第未来(Faraady Futur...
苹果MacBook Pro更新... 【环球网科技综合报道】1月26日消息,据彭博社记者 Mark Gurman报道,配备 OLED 触控...
全球首份动力电池循环经济研究报... 来源:市场资讯 (来源:中化新网) 中化新网讯 1月20日,瑞士达沃斯——世界经济论坛年会期间,艾伦...
“太空旅行”不算新闻了,他已开... 最近,一则消息持续轰炸网络:我国某商业航天公司将在2028年送第一批旅客进入太空,其中签约者不乏“行...
原创 一... 尽管“能源—暴风雪”计划规模空前,在整个前苏联境内留下了大量遗迹,但在众多建成的飞行器和试验模型中,...
黑河市消防救援支队党委委员慰问... 党委委员看望慰问 新训带训骨干 黑河市消防救援支队 1月25日上午,黑河支队党委委员、政治部主任韩宝...
东徕硕取得多功能电池支架专利,... 国家知识产权局信息显示,昆山东徕硕塑胶有限公司取得一项名为“一种多功能电池支架”的专利,授权公告号C...
南方科技大学孟庆虎:马斯克关于... “Optimus(特斯拉旗下的人形机器人)什么时候能超越人类最好的外科医生?答案是三年内,而且是规模...
Faker唯一不会用的英雄有了... 大家好,S16赛季的比赛已经正式开始了,相信绝大多数的玩家都关注了最近一段时间的对抗,Lck赛区的比...
联想申请PUSCH资源指示机制... 国家知识产权局信息显示,联想(北京)有限公司申请一项名为“PUSCH资源指示机制”的专利,公开号CN...
全球首创!奥克化学锂电池添加剂... 近日,辽宁奥克化学股份有限公司与吉林奥克新材料有限公司联合研发的“环氧乙烷与二氧化硫催化合成锂电池添...
原创 猎... 大家好,我是正在看剪影的何二维一。 今天官方也是正式放出了1.5版本春节魂师千仞雪的人物剪影,其实吧...
原创 猎... 大家好,我是正在汇总信息的何二维一。 今天游戏也是于先遣服正式更新了1.5版本,虽然内容量和咱们之前...
《生化危机:安魂曲》导演称新作... IT之家 1 月 26 日消息,《生化危机:安魂曲》导演中西晃史今天接受游戏媒体 EuroGamer...
华为多款手机通过星闪认证,测试... IT之家 1 月 26 日消息,国际星闪联盟官网显示,华为多款手机新通过了星闪认证,主要覆盖车钥匙协...
苹果新一代Siri下月登场!i... 快科技1月26日消息,本月早些时候,苹果与谷歌正式宣布达成合作,为今年晚些时候推出的产品功能(如Si...
“写实动漫风”的终末地,靠什么... 最近几天,就算你没玩过《明日方舟:终末地》(以下简称《终末地》),大概率也从各个渠道知道了这款游戏公...
1月27日精选热点:马斯克星舰... 1、算力租赁:腾讯春节分10亿现金,百度文心助手5亿跟进春节AI大战 据报道,腾讯发布《关于春节分1...
史上最优秀移动处理器!酷睿Ul... 一、前言:能与Zen 5不相上下的E-Core 如果一个月前有人告诉你1款拥有16个大核的高性能笔记...
四川省地质灾害风险预警系统通过... 为进一步优化提升地质灾害防治业务系统功能,响应新形势下精细化、智能化防灾减灾需求,自然资源厅抓住增发...