百度文心Moment大会开幕 文心大模型5.0正式发布
创始人
2026-01-23 23:01:32
0

1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

目前,个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。在40余项权威基准的综合评测中,文心 5.0 正式版的语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,稳居国际第一梯队。图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。此前,百度文心助手月活已突破2亿。

拒绝“拼接”,告别转译,原生全模态理解输出

据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。

560 && this.height > this.width ? 560: true);">

此外,文心5.0采用超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于 3%,在保持模型强大能力的同时,有效提升推理效率。同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。

“应用模型的价值不在模型里,而在应用里”

现场,百度应用模型研发部负责人贾磊分享了文心应用模型的最新进展。他指出,应用模型的价值不在模型里,而在应用里,希望让模型在真实应用场景里“跑得稳、答得对、用得起”。

560 && this.height > this.width ? 560: true);">

基于文心基础大模型,百度构建了矩阵模型和专精模型。矩阵模型面向产品级应用和通用场景快速落地,包括文心Lite模型、视频大模型和语音大模型;专精模型面向行业应用和垂直场景,包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型。

贾磊在现场分享了三项技术突破:基于声音 Token 的端到端合成大模型、5分钟超越真人的直播技术、实时交互数字人技术。

基于声音Token的端到端合成大模型由满帧语音token的离散表示来定义token,以MoE大语言模型来建模韵律,基于flow的后处理来描述声音的谱分布,基于Unet的自重构特征的vocoder来描述刻画声音。

5分钟超越真人的直播技术通过对目标音色的少量采样,经过脸谱和化妆,通过检索增强匹配不同文体和场景的韵律模式,使合成语音具备直播带货所需的情绪、节奏与感染力。

实时交互数字人技术采用三态Token联动架构,实现文本、语音、视频的流式控制,突破传统数字人三个模态串联的制作模式。在此基础上,系统自动完成动作衔接、动作编排与状态重组,并由声音Token实时驱动表情与口型,输出三态合一的视频流,具有低延迟、低成本和高表现力的特点,百度罗永浩数字人即是基于这项技术开发。

全流程支持,百度千帆助力大模型落地产业

百度的数字人生成技术,此前已广泛应用于直播带货等场景,2025年罗永浩数字人直播就曾打破行业记录。在模型应用赋能行业的背后,是百度基于多年积累的全栈自研实力,打通“芯云模体”的全链技术架构。

560 && this.height > this.width ? 560: true);">

在文心Moment大会当天,百度千帆平台产品负责人张婷详细介绍了千帆专为行业落地打造的Agent Infra,平台提供包括文心5.0及全场景150+SOAT模型服务,集成包括百度AI搜索在内的众多工具及MCP和Agent工具链,并结合数据管理和企业级服务,可以为企业提供全周期、稳定支持多场景业务的运行环境,显著降低企业Agent创新门槛。

目前,千帆平台上已累计开发超130万个Agents,以百度独家能力“百度AI搜索”为代表的工具日均调用量已突破千万次。

基于强大的原生全模态统一建模技术,与2.4万亿参数的海量算力,“文心5.0”已具备让AI应用走进真实行业与复杂场景,提供更高效解决方案的能力。全球AI行业经历过去几年快速发展,正进入一个新的快车道,但在AI应用领域,以对话或文字输入为主的Chatbot仍是主流形式。AI如何应用于真实世界与行业,从而进一步产生价值,是行业都在探索的方向。

作为国内最早发布大模型的企业之一,百度正基于多年积累的技术实力,形成以芯片为底座,智能云为平台框架,以模型支撑各类智能体应用的“芯云模体”全栈自研生态闭环,持续探索赋能行业的AI解决方案。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

热门资讯

重仓服务的商家们,迎来他们的红... 文丨刘文妍 编辑丨周近屿 在一个高度规模化的商业体系中,持续增长的核心往往在于补齐那些关键的能力短板...
智库动态 | 应对能碳挑战,绿... 当前算力快速扩张,数据中心用电量和碳排放正成为全球关注的焦点。据中国信通院预测,到2030年,中国数...
原创 J... LPL精彩赛事依旧在火热进行中,这一次是JDG和BLG的对决,赛前大部分人都是看好BLG会获胜,BL...
塔卫二前夜 新人 1月21日,《明日方舟:终末地》(下文简称终末地)公测前一天,我的聊天对话框一直在不停地跳出内...
Meta“元宇宙”VR会议应用... IT之家 1 月 23 日消息,Meta 宣布将于 2026 年 2 月 16 日正式关停旗下 VR...
推进星座部署 卫星互联网走进大... (记者 陈晓晟)步入2026年,我国航天领域又传捷报:卫星互联网低轨18组卫星成功发射入轨。而在半个...
捉宠游戏见多了,把人变成宠的还... 今天(1月23日),爪印工作室研发的大世界抓宠RPG《伊莫》正式开启了“挥爪测试”(二测)。在去年,...
原创 L... 经过漫长的休整期之后,重组的LPL 2026第一赛段终于在1月14日,正式拉开序幕。各支重组之后的队...
西部首个机器人交易中心在成都高... 中新网成都1月23日电 (记者 王鹏)2026智能机器人城市空间应用场景大会23日在成都高新区举行,...
BOSS直聘陈旭:AI是工具,... 新浪科技讯 1月23日上午消息,近日,在BOSS直聘举办的“一起生长·ECHO2026”年度合作伙伴...
谁给鹰角胆子做这么「硬核」的科... 昨天(1月22日),备受瞩目的鹰角新作《明日方舟:终末地》终于公测了。 而据鹰角官方刚刚发布的消息,...
跨耀工具取得手推式磁力吸铁车专... 国家知识产权局信息显示,金华市跨耀工具制造有限公司取得一项名为“一种手推式磁力吸铁车”的专利,授权公...
百度文心Moment大会开幕 ... 1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统...
霸总出山展示强大实力?倩女端游... 如果你也曾是霸总文学的爱好者,那你一定对小说《微微一笑很倾城》里的“真水无香”印象非常深刻吧!作为一...
宝坻区大口屯镇:跨越数字鸿沟,... 近日,宝坻区大口屯镇民政服务站联合宝坻区宝青社会工作服务中心、新网户村新时代文明实践站,开展“跨越数...
烟台高新区:“智汇烟大·溪创未... 胶东在线1月23日讯(通讯员 郭健 实习编辑 单煜媛)近日,由烟台大学、溪有物种等联合主办、中关村烟...
【招引成绩】超1.6万亿元 内... 内蒙古台记者李木子说:“这里是位于呼和浩特市和林格尔新区的科拓生物,是亚洲技术最先进的益生菌产业化智...
“高效办成一件事”,109项服... 深圳新闻网2026年1月23日讯(记者 李昂徽)1月22日上午,深圳市妇女联合会在市妇儿大厦举行“深...
2026文本价值觉醒,赋能智能... 今天分享的是:2026文本价值觉醒,赋能智能决策——多模态大模型文本智能白皮书 报告共计:85页 多...
两会观察:杭州的新坐标,不止人... 来源:中国新闻网 中新网杭州1月23日电(奚金燕 蓝伊旎)一座城市的新目标、新定位、新打法,往往浓缩...