谷歌发布Gemini 3.1 Flash-Lite:首字响应提速2.5倍
创始人
2026-03-04 09:21:29
0

原标题:Gemini 3 系列中速度最快、最具成本效益 AI 模型:谷歌 Gemini 3.1 Flash-Lite 登场,首字响应提速 2.5 倍

IT之家 3 月 4 日消息,谷歌昨日(3 月 3 日)发布博文,宣布推出轻量级 AI 模型 Gemini 3.1 Flash-Lite,声称是其速度最快、最具成本效益的 Gemini 3 系列模型。

开发者目前可通过 Google AI Studio 中的 Gemini API 获取预览版,企业级用户也能在 Vertex AI 平台上同步体验。

价格方面,为大幅降低 AI 应用门槛,谷歌为该模型制定了极具竞争力的价格:每百万输入 Tokens 收费 0.25 美元,每百万输出 Tokens 为 1.50 美元。

在低售价的同时,Gemini 3.1 Flash-Lite 在性能方面实现大幅跨越。权威评测平台 Artificial Analysis 的数据显示,与前代 2.5 Flash 相比,新模型的首字响应速度(TTFT)暴涨 2.5 倍,整体输出速度同步提升 45%。这种极低延迟特性,让其成为构建实时响应体验的理想之选。

在各项核心能力测试中,3.1 Flash-Lite 展现出越级挑战的实力。该模型不仅在 Arena.ai 排行榜上斩获了 1432 分的 Elo 得分,更在多模态理解与逻辑推理测试中全面领先同级竞品。

具体而言,它在 GPQA Diamond 测试中得分率高达 86.9%,在 MMMU Pro 测试中达到 76.8%,甚至在多项指标上超越了体积更大的上一代 Gemini 2.5 Flash 模型。IT之家附上相关数据如下:

除了硬核的性能指标,3.1 Flash-Lite 还在 AI Studio 和 Vertex AI 中标配了创新的“思考层级(thinking levels)”功能。

这一机制支持开发者灵活控制模型在执行任务时的“思考深度”:

在处理海量翻译或内容审核等对成本极度敏感的基础任务时,开发者可调低思考深度以追求极致效率;

而在面临生成用户界面、构建数据看板或复杂逻辑模拟等高难度任务时,则可调高思考层级,激发模型更深度的推理能力。

Latitude、Cartwheel 以及 Whering 等早期测试企业目前已率先将 3.1 Flash-Lite 部署于复杂的业务场景中。测试团队反馈称,该模型不仅具备卓越的处理效率和逻辑推理能力,还能以媲美大型模型的精准度处理复杂输入指令。

相关内容

热门资讯

谷歌发布Gemini 3.1 ... 原标题:Gemini 3 系列中速度最快、最具成本效益 AI 模型:谷歌 Gemini 3.1 Fl...
上海干细胞临床转化研究院:20... 今天分享的是:上海干细胞临床转化研究院:2025干细胞标准化研究蓝皮书 报告共计:85页 《2025...
中国移动在线申请手机卡全攻略:... 你是不是也在网上刷到过各种眼花缭乱的手机卡广告?19元100G,29元流量随便用,看着是真诱人,但又...
汉威科技凭高端传感器“叩开”人... 切入人形机器人赛道,汉威科技(300007.SZ)有望打开新的增长空间。 在国内传感器产业迭代升级与...
欧克科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示欧克科技(001223)新获得一项发明专利授权,专利名为“一种...
智能体浪潮奔涌 重塑产业格局前... 本报两会报道组 袁传玺 当2024年“人工智能+”行动首次被写入政府工作报告,当大模型技术从实验室走...
华为提出构建以AI为中心的全光... 来源:市场资讯 (来源:环球网资讯) 来源:环球网 2026年3月2日在MWC26 巴塞罗那期间,华...
龙成新能源取得节能超导速热器专... 国家知识产权局信息显示,哈尔滨龙成新能源科技有限公司取得一项名为“一种节能超导速热器”的专利,授权公...
2026年 大数据专业服务商推... 2026年大数据专业服务商推荐:前沿技术驱动与行业解决方案深度解析 随着数字化转型进入深水区,大数...
委员声音|以“百亿智能体”夯实... 编者按: 2026年全国两会启幕在即,恰逢“十五五”开局之年,人工智能、集成电路、新质生产力培育等关...
苹果M5系列MacBook P... IT之家 3 月 3 日消息,苹果今晚(3 月 3 日晚)正式发布了 M5 系列 MacBook P...
共话可靠的互联网医院申办公司,... 在互联网医疗蓬勃发展的当下,越来越多的医疗机构和企业渴望入驻线上平台,开展互联网医疗服务。然而,申办...
CIO摒弃ITIL传统服务管理... 刚性IT框架曾经是IT部门将混乱恢复为秩序的最佳方式。但传统的基于工单的请求-审批-等待方式已不再适...
Unity终止中国区访问海外资... “OpenAI不Open,团结引擎不团结。” 今日,全球知名游戏引擎Unity正式发布通知,称因区域...
烟台联通开展网络安全意识专题培... 近日,烟台联通为某企业举办了一场针对性强、内容丰富的网络安全意识专题培训,旨在提升企业员工的网络安全...
王者世界争鸣测试将开启《王者荣... 大家好,近日王者世界多人冒险游戏《王者荣耀世界》官方宣布,本作正式定档四月,iOS预约已开启。本作研...
《榜样10》 | 冷晓琨——让... 冷晓琨,1992年9月生,中共党员,乐聚智能(深圳)股份有限公司董事长,哈尔滨工业大学计算学部研究员...
苹果M5芯片MacBook P... IT之家 3 月 3 日消息,苹果发布搭载 M5 Pro/M5 Max 芯片款 MacBook Pr...
电网“呼吸卫士”开工即满产 正月十四,国网湖北省电力有限公司六氟化硫气体回收处理中心的厂区内已是一派繁忙景象。机器轰鸣声中,身着...
高通携6G核心技术成果亮相MW... 【环球网科技综合报道】巴塞罗那2026年世界移动通信大会(MWC26)期间,高通技术公司执行副总裁兼...