7月22日,2025年现代科技馆体系联合行动“AI生活”主题科普活动主场活动在浙江省科技馆举行。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜以“大模型驱动应用创新与产业升级”为题,深入剖析了以大模型为代表的人工智能技术的最新进展及其对产业变革的深远影响。吴甜表示,大模型技术已经从实验室深入到千行百业的深度应用场景,正成为驱动产业智能化升级的关键新质生产力。
吴甜表示,人工智能的本质在于模拟、延伸和拓展人类智能。当前,大模型凭借卓越的效果、强大的泛化性和标准化的研发流程,正引领人工智能技术发展进入新高潮。大模型作为关键的新质生产力,不仅深刻变革人机交互模式,更通过高效解决实际产业场景问题,为产业智能化升级提供坚实的技术支撑。
以百度文心大模型为例,自2019年发布以来一直持续迭代,今年4月发布的文心大模型4.5 Turbo和文心大模型X1 Turbo,多模态、深度思考等能力不断增强。
在多模态方面,文心大模型4.5系列实现了文本、图像和视频的混合训练,通过一系列技术大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。
在后训练方面,百度研制了自反馈增强的技术框架,实现了“训练-生成-反馈-增强”的模型迭代闭环,让大模型拥有了自我迭代的“最强大脑”,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率。通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。
而在深度思考、数据等方面,文心大模型效果提升也很大。在深度思考方面,它不仅突破了只基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,同时结合多元统一的奖励机制,实现了思考和行动链的端到端优化,跨领域通用能力显著增强,整体效果提升22.40%;数据方面,文心大模型打造了“数据挖掘与合成-数据分析与评估-模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。
吴甜现场展示了百度联合中国科技馆开发的“科技馆智能体”,它结合了中国科学技术馆丰富的科普知识数据与文心大模型技术,不仅能为科技馆内的观众提供基础信息、导览等服务,还能随时为身处各地的青少年解答科学问题。此外,基于文心大模型的文本能力,展示了设计逻辑清晰、互动性强的科技馆展台讲解方案。基于文心大模型的多模理解能力,展示了大模型对科技馆装置的理解与认知能力。这为未来的科普讲解等场景提供了低成本、高质量、知识完备的解决方案参考。
数字人是融合大语言模型与多模态技术的创新应用。今年6月15日,罗永浩和搭档萧木的数字人在百度电商平台开播带货,肢体动作、语音语调、讲解产品、弹幕互动甚至讲段子,逼真效果连老罗本人看了都吓一跳。据吴甜现场介绍,其背后应用的是百度剧本驱动多模协同的高拟真数字人技术。基于文心大模型4.5 Turbo实现了融合多模规划与深度思考的剧本生成,由剧本驱动数字人多模协同,实现动态决策的实时交互,使数字人的“神、形、音、容、话”达到高度统一,最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。未来,也期待科普数字人应用到科技馆的讲解等场景中。
随着人工智能通用性越来越强,AI在千行百业的应用也越来越深入,赋能农业、制造、能源、交通、金融、教育、医疗、媒体等千行百业转型升级。吴甜指出,大模型真正赋能千行百业,离不开强大易用的基础平台支撑和繁荣的人工智能技术生态。
以飞桨为例,作为百度自研的产业级深度学习开源开放平台,它从核心框架、基础模型库,到端到端开发套件、工具与组件,以及星河社区等,全方面支持了文心大模型的演进过程。文心大模型的能力拓展和效率提升,得益于飞桨和文心的联合优化,通过训练和推理的技术创新,文心大模型4.5 Turbo训练吞吐达到文心大模型4.5的5.4倍,推理吞吐达到8倍。
基础平台需要大量的开发者共建,飞桨正持续赋能开发者,飞桨AI Studio星河社区已上线700万个实践项目,600多门公开课以及400多场AI竞赛。截至今年4月,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。
吴甜最后表示,百度将持续投入文心大模型与飞桨平台的建设,通过技术创新降低应用门槛、繁荣开发生态,与各界伙伴共同推动新质生产力发展,加速产业智能化升级进程。
来源:新民晚报 作者:金志刚