【数媒在线课堂】新的基础设施
创始人
2025-07-03 00:21:49
0

应用边界在不断拓宽的同时,多模态模型的能力也在成长。

而随着应用场景的深化,模型架构也在同步进化,从基础感知迈向复杂推理成为必然趋势。OpenAI 在 2025 年 4 月发布了多模态模型 O3 和 O4-mini,实现了 “用图像思考” 的突破性能力。这些模型不仅能够识别图像内容,还能将图像信息整合进推理思维链,支持多步推理和因果分析,比如够处理模糊、倒置或复杂的图像输入,并给出合理的推理结果。

其背后的关键技术包括分层注意力机制,将图像分解为局部细节、全局关系和时序逻辑三层结构,从而提升对图像内容的理解能力;动态工具链调用,在推理过程中,模型可以自主选择 Python 分析、知识图谱检索、图像生成等工具辅助决策,以及安全约束模块,通过对抗训练减少模型的幻觉输出。

就在本月,中国科学院自动化研究所等单位的科研人员首次证实,多模态大语言模型在训练过程中自己学会了 “理解” 事物,而且这种理解方式和人类非常像。

科研人员借鉴人脑认知的原理,设计了一个巧妙的实验:让大模型和人类玩 “找不同” 游戏。实验人员会给出三个物品概念(选自 1854 种常见物品),要求选出最不搭的那个。通过分析高达 470 万次的判断数据,科研人员绘制出了大模型的 “思维导图”——“概念地图”。通过实验证实多模态大模型具备类人 “概念理解” 能力。研究团队设计 “找不同” 游戏,基于 470 万次判断数据绘制大模型 “概念地图”,提炼 66 个理解维度(如物体功能、文化意义),发现其与人脑神经活动高度一致,证明多模态模型比纯文本模型更接近人类思维模式。

据谷歌云在 2024 年年底发布的《2025 年人工智能商业趋势报告》,预测到 2025 年,多模态 AI 将成为企业采用 AI 的主要驱动力。这种技术通过整合图像、视频、音频和文本等多种数据源,使 AI 能够以前所未有的准确性从更广泛的上下文源中学习,提供更精确、定制化的输出,创造自然直观的体验。报告预计,全球多模态 AI 市场规模将在 2025 年达到 24 亿美元,到 2037 年底达到 989 亿美元。

2025 进度已经过半,我们也能看到市面上许多多模态技术和产品的进展,而这场变革的终极图景,或许正是让 AI 真正成为理解世界、服务人类的 “多模态智能伙伴”。

相关内容

热门资讯

赛意信息牵头承担国家科技重大专... 赛意信息(300687)12月14日公告,近日,公司收到国家主管部门下发的《关于智能制造系统和机器人...
vivo手机哪款性价比最高最值... 最新销量数据显示,vivo X200系列全系销量已接近460万台,成为vivo史上最畅销的旗舰系列。...
Windows 11什么配置才... 快科技12月15日消息,近日微软发布了一份官方指南,介绍了针对2026年Windows 11平台的游...
将强制执行!速看最新要求→ 为解决消费者 关于旧手机、旧电脑等电子产品 进入回收渠道 个人信息没有被有效清除的担忧 近日 强制性...
2025年大流量卡办理全攻略:... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
曝小米等厂商中端机型价格上涨 ... 【CNMO科技消息】12月15日,数码博主“数码闲聊站”发文称,小米部分在售平板产品已涨价,涨幅在1...
每周工作动态丨速览(12月8日... 一周工作动态 12月8日—12月14日 01 ▶2025腾冲科学家论坛背后的“卫健力量” 2025...
《颂钟长鸣》大型更新概览:新基... 在12月10日上线的《颂钟长鸣》第四季度大型免费更新中,玩家将探索哈尔玛尔群岛上多个全新地标与可互动...
原创 设... 近日,炉石传说迎来2025年最后一波补丁更新,让人意外的是,这一次并没有对当前热门卡组进行削弱,反而...
手机副卡和主卡有什么区别?一篇... 办卡:微 信 公 众 号 搜【 可可 找卡】,每天更新运营商官方高性价比套餐!帮你精准匹配适配流量方...
奥佳华:基于中医穴位理论的智能... 证券之星消息,奥佳华(002614)12月15日在投资者关系平台上答复投资者关心的问题。 投资者提问...
马斯克公开唱衰核聚变 直言建造... 来源:科创板日报 今日,埃隆·马斯克在社交平台X上公开唱衰核聚变发电。其直言不讳道:“在地球上建造小...
让众多科技成果从实验室走向市场... 在上海宝山区这片科创热土上,以环上大科技园零号基地为起点,700多家企业正拔节生长,200多项源自实...
来华留学生国情教育的多维构建与... 2020年,习近平总书记给北京科技大学全体巴基斯坦留学生回信,勉励他们“同世界各国青年一道,携手为促...
第十四届中国创新创业大赛创新挑... 阳光讯(记者 赵生杰)因创而聚,向新同行。12月13日,第十四届中国创新创业大赛创新挑战赛(西安)未...
矽源特ChipSourceTe... Ⅰ、产品核心技术架构与性能优势 (1)创新功放架构设计 AB/D 类可切换模式:矽源特ChipS...
DDR5内存价格飙升,AM4平... IT之家 12 月 15 日消息,受人工智能驱动的 DRAM 需求激增、HBM 产能重新分配以及工业...
华为nova 15系列上架:共... 华为已经官宣,将于2025年12月22日正式发布全新的华为nova 15系列手机。目前,华为nova...
一根丝线的“东成西就”:当东部... 提到丝绸,你是否会联想到江南水乡的橹声灯影? 今天,当你展开新买的丝巾,它的故事可能早已不同——桑叶...
冰雪经济一线观察|冰雪装备制造... 近年来,我国冰雪装备自主研发能力不断提升。 在山东,一些企业加大技术攻关力度,在碳纤维滑雪板、室内滑...