信达证券:世界模型赋能AI,自动驾驶与机器人有望突破瓶颈
创始人
2025-03-07 12:42:01
0

财中社3月7日电信达证券发布电子行业报告。

世界模型研究进展迅速,应用端机遇与挑战并存。长期以来,科学界一直渴望开发一个统一的模型,该模型可以复制其世界的基本动态,以追求通用人工智能(AGI)。世界模型尚无统一的定义,英伟达官网的定义为:“世界模型是理解现实世界动态(包括其物理和空间属性)的生成式AI模型。它们使用文本、图像、视频和运动等输入数据来生成视频。通过学习,它们能够理解现实世界环境的物理特性,从而对运动、应力以及感官数据中的空间关系等动态进行表示和预测。” Sora发布之后,世界模型获得了更为广泛的关注。从功能方面看,在许多用例中,Sora确实具备一定的理解和预测世界的能力,且其生成的视频在大部分时候也能有良好的一致性。但也有人认为Sora仅是像素层面的生成,这会导致一些无法解释的现象,这表明Sora并未理解物理世界。从技术架构看,Sora是一种基于扩散的视频生成模型。但是无论如何,Sora的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前景的途径。应用层面看,随着视觉生成模型和多模态大模型的进展,世界模型在自动驾驶领域受到了广泛的关注。使用基于扩散的视频生成模型作为世界模型可以部分解决信息丢失和建模效率低下的问题,近年来已有相关的研究在不断进行。机器人领域的应用也是主要方向之一,世界模型让机器人在现实中处理通用任务展示出巨大前景。传统的机器人关键组件会被建模,机器人在执行任务时无需理解世界。而当机器人被部署在新的场景中时,机器人可能会手足无措,因此,世界模型对物理世界的理解和预测能力是机器人智能化的关键利器,LLMs和世界模型被认为是实现通用人工智能(AGI)的可能途径之一,它们可以成为机器理解世界基本规律的起点。目前AI发展迅速,大模型正快速学习如何理解物理世界,世界模型也有望迎来快速迭代时期。在近期发布的大模型中,o3-mini可以模拟生成一个小球在四维超立方体内弹射的Python代码。而Grok3则可以模拟航天器任务,生成的3D动画准确描述了飞船、地球、太阳、火星的位置关系。这些成果有可能从底层催动世界模型的进展,让AI的智能化进入更高的水平。

众多厂商推出世界模型,相关领域已展开角逐。英伟达推出Cosmos,赋能机器人和自动驾驶开发者。Cosmos世界基础模型是一套用于物理感知视频生成的开放式扩散和自回归Transformer模型。这些模型已基于2000万小时的真实世界人类互动、环境、工业、机器人和驾驶数据,训练了9,000万亿个token。李飞飞创立World Labs,探索从2D到3D的路径。World Labs是一家空间智能AI公司,由在AI学术领域享有盛誉的李飞飞博士创立。World Labs致力于构建空间智能大型世界模型(LWM)来感知、生成3D世界并与之交互。其目标是将AI模型从像素的2D平面提升到完整的3D世界。World Labs仅创立了三个月,便吸引了英伟达、AMD等公司的融资,估值超过10亿美元。谷歌旗下DeepMind推出Genie2,性能强大用例广泛。Genie 2是一种自回归潜在扩散模型,在大型视频数据集上进行了训练。通过自动编码器后,视频中的潜在帧被传递到大型transformer动力学模型,该模型使用类似于大型语言模型使用的因果掩码进行训练。在推理时,Genie 2可以以自回归方式进行采样,逐帧执行单个作和过去的潜帧。谷歌使用无分类器的指导来提高可控性。在DeepMind官网上,Genie2的能力也非常强大。昆仑万维发布Matrix-Zero,国产模型紧追不舍。昆仑万维发布的Matrix-Zero世界模型包含两款子模型,其中,3D场景生成大模型支持将用户输入的图片转化为可自由探索的真实合理的3D场景。而可交互视频生成大模型,提供以用户输入为核心驱动的可交互空间智能视频生成方案,支持根据用户实时输入生成互动视频效果,具备更精准控制的action model。

投资建议:无论是北美还是国内,推理成本的降低及推理性能的迅速提升趋势非常显著。微软董事长Satya Nadella曾在法说会表示,每代硬件的性价比提高2倍以上,而由于软件优化,每代模型的性能提升10倍以上。DeepSeek卓越的性价比让人印象深刻,据Semianalysis观察,在GPT-4上同样有类似的趋势,即每过一年,算法改进和优化使得推理成本降低10倍,同时性能提升10倍。因此,认为,AI的发展目前正如火如荼地进行着,大模型不会满足于帮人类查找资料这样的小事,长期看它甚至具备改变部分行业运行逻辑的潜力。而当前伴随推理性能的提升和推理成本的降低,许多算力密集型的场景有了落地的可能,本文所探讨的世界模型便是其中一个例子。世界模型可以帮助端侧理解并预测世界,从而产生正确的决策。从云来看,由于多模态数据的训练与推理,算力需求总体仍然呈现迅速增长的趋势;而从端来看,人形机器人、自动驾驶等重要赛道有望迅速前进,以突破目前的智能化瓶颈。AI呈现出巨大的产业前景,建议关注相关产业链优质个股。

相关内容

热门资讯

南阳市恒中机电取得压铸机清洁装... 金融界2025年8月1日消息,国家知识产权局信息显示,南阳市恒中机电有限责任公司取得一项名为“一种压...
中手游满天星工作室总经理因涉嫌... 7月30日,有消息称,中手游(00302.HK)发布内部通报,旗下原满天星工作室总经理姜某某因涉嫌严...
别人家导师送礼物——把学生本人... 2025 年 7 月 4 日,国际知名期刊 Trends In microbiology 上线了最新...
米哈游《原神》不正当竞争案胜诉... IT之家 8 月 1 日消息,米哈游法务部刚刚发文称,米哈游诉上海寻梦信息技术有限公司(以下简称“拼...
青云科技荣获维科杯 2025 ... 维科杯・OFweek 2025(第十届)人工智能行业年度评选结果正式揭晓,青云科技荣获 “人工智能行...
库克表示,苹果计划“大幅”增加... 来源:电子产品世界 苹果公司于周四表示,它正更加认真地对待其追赶人工智能竞赛的计划。 “我们将人工智...
从实验室到产业一线,浙师学子以... 暑假里的浙江师范大学校园,少了几分平日的熙攘,众创空间却热度不减。实验室的灯光与产业一线的晨光交相辉...
上海贝岭获得发明专利授权:“抗... 证券之星消息,根据天眼查APP数据显示上海贝岭(600171)新获得一项发明专利授权,专利名为“抗共...
努比亚布局游戏二次元 携手洛天... 8月1日,第22届中国国际数码互动娱乐展览会(ChinaJoy)在上海盛大启幕。中兴通讯终端品牌努比...
“都说不来,怎么今年China... 大观园,小缩影。 文/严锦彦 直到今年ChinaJoy举办的前两天,葡萄君对它的预期都不算高。 今时...
两项高压直流开关设备领域国际标... 记者从市场监管总局获悉,由我国牵头制定的两项国际标准《高压开关设备和控制设备 第313部分:直流断路...
《战地6》多人试玩:破坏系统展... 在EA公布《战地6》多人模式详情后,受到EA邀请的媒体,内容创作者们在现场参加了《战地6》的多人模式...
以后可别再说控制欲强了 研究 怪怪的你 关注了怪怪的不正常 以后可别再说控制欲强了 你控制下食欲试试看呢 我承认,年轻时...
原创 1... 杰克走在热闹非凡的大街上,周围的机器人忙碌而有序地工作着,制作美食、设施维修、街道巡逻......一...
这事不能掉链子!解锁隐藏角色,... 👆点击选项参与答题 👆点击选项参与答题 👆点击选项参与答题 👆点击选项参与答题 👆点击选项参与答题...
原创 为... 火影忍者手游近期上架的A忍夏日黑土表现一般,B忍夏日香燐更是完全没人讨论,相较于之前预热力度等方面都...
《植物大战僵尸:重植版》开启预... 植物大战僵尸™:重植版 预购*《植物大战僵尸™:重植版》,即可获得一款复古豌豆射手皮肤! 重温一...
第二十二届ChinaJoy开幕... 中新网上海8月1日电 (记者 王笈 康玉湛)第二十二届中国国际数码互动娱乐展览会(2025 Chin...
《七龙珠 电光炸裂!ZERO》... Nintendo Switch™ 2/Nintendo Switch™版《七龙珠 电光炸裂!ZERO...
一加高调亮相 2025 Chi... 【CNMO科技消息】8 月 1 日,2025 年中国国际数码互动娱乐展览会(ChinaJoy)盛大开...