不再依赖美国!新加坡国家AI计划“换心”阿里千问
创始人
2025-11-25 22:01:30
0

11月24日,阿里云与新加坡国家人工智能计划(AISG)联合发布了一则重磅消息:新加坡最新的国家级大语言模型“海狮”(Sea-Lion v4),将不再沿用此前的美国技术路线,而是全面基于阿里的通义千问Qwen3-32B开源模型构建。

这是继硅谷大佬Chamath Palihapitiya宣布用Kimi取代OpenAI作为生产力工具,美国Vercel、Windsurf等编程平台接入智谱模型,爱彼迎CEO表示阿里Qwen比美国模型更好用后,中国开源模型在全球市场的最新成绩。而本次新加坡国家人工计划的认可也意味着在“主权AI”和“多语言适配”的赛道上,中国开源大模型已经具备了替代甚至超越硅谷巨头的能力。

2023年12月,新加坡启动了一项7000万新元(5200万美元)的计划,旨在建立多模态大型语言模型 (LLM)的研究和工程能力,其中包括开发 Sea-Lion(东南亚语言一体化网络)。

然而,这片拥有6亿人口、数字经济规模奔向万亿美元的市场,长期以来却是西方AI的“盲区”。

这种“盲区”首先体现在数据的极度匮乏上。在Sea-Lion诞生前,被广泛使用的meta Llama 2等主流模型中,东南亚语言内容的占比仅为惊人的0.5%。

这种以英语为中心的训练逻辑,导致当时以meta旗下开源模型Llama2训练的Sea-Lion几乎是个“东南亚文盲”。在早期的测试中,该模型将南美洲的委内瑞拉列为了东盟成员国。这种缺乏区域常识的“幻觉”,暴露了西方通用模型在本地化应用上的致命短板。

更让当地开发者头疼的是语言文化的隔阂。东南亚地区盛行“语码转换”,即在英语中夹杂方言,例如新加坡式英语(Singlish)或马来西亚式英语(Manglish)。面对这种复杂的混合语境,标准的美式AI模型往往束手无策,无法理解其中的细微差别和文化梗。

虽然Llama性能在开源模型中当时位列头部,但其“英语中心主义”的基因始终难以改变,在处理泰语、缅甸语等非拉丁语系文字时效率极低。

AISG逐渐意识到,使用硅谷的开源模型进行开发并不是最适合东南亚国家的解,他们必须寻找一个真正懂多语言、懂亚洲语境的底座。

而本次发布的v4版本,AISG最终将目光投向了中国,选用了阿里的Qwen3-32B作为新一代Sea-Lion的基座模型。

与西方模型不同,Qwen3的基础模型在预训练阶段就通过了36万亿个token的数据训练,覆盖了全球119种语言和方言。这种“原生多语言能力”让Qwen不仅“懂”印尼语、马来语,更从底层逻辑上理解这些语言的语法结构,大大降低了AISG后续训练的门槛。

为了解决东南亚语言独特的书写习惯问题,Qwen-Sea-Lion-v4摒弃了西方模型常用的“句子分词器”,转而采用了更先进的字节对编码(BPE)分词器。鉴于泰语、缅甸语等语言通常没有明显的词间空格,BPE技术能更精准地切分非拉丁语系的字符,不仅提高了翻译的准确度,还大幅提升了推理速度。

除了技术指标,商业落地的现实考量也是阿里胜出的关键因素。东南亚拥有大量中小企业,他们无力承担昂贵的H100 GPU集群。Qwen-Sea-Lion-v4经过优化,可以在配备32GB内存的消费级笔记本电脑上流畅运行。

这意味着,一个普通的印尼开发者,仅凭一台高配电脑就能在本地部署这个国家级模型。这种“工业级能力,民用级门槛”的特性,恰恰切中了该地区算力资源稀缺的痛点。

此次合作也并非简单的“单向技术输出”,而是一种深度的双向融合。根据协议,阿里提供了强大的通用推理底座,而AISG则贡献了其珍贵的、经过清洗的1000亿个东南亚语言token。这些数据完全去除了版权风险,且东南亚内容的浓度高达13%,是Llama2的26倍。

阿里通过“高级后训练”技术,将这些独特的区域知识注入Qwen,使其能精准捕捉当地的文化神韵。这种强强联合的效果立竿见影——在Sea-Helm评估榜单上,搭载了阿里“心脏”的Sea-Lionv4,迅速在同量级开源模型中占据了榜首位置。

如果说之前千问,Kimi,智谱等模型纷纷获得硅谷大佬认可是基于性能和性价比的双重优势因素,那么本次翻看AISG项目一路从AWS到阿里云,从Llama到Qwen,新加坡Sea-Lion项目的演变,折射出全球AI格局正在发生微妙的权力转移。

长期以来,全球技术基础设施几乎被美国垄断。但在大模型时代,中国企业凭借对多语言环境的深刻理解和极致的性价比优化,正在成为“全球南方”国家构建主权AI的首选合作伙伴。

相关内容

热门资讯

女报评论|祛AI魔改之“魔”,... AI技术衍生出的网络乱象,不断变换花样泛起。近两年,诸多视频平台兴起一阵AI“魔改”风。从《甄嬛传》...
小学生沉迷“刷赞当大佬”,每天... 儿童电话手表已成为未成年人数字社交圈的载体。电话手表的功能不断迭代,早已突破“定位+通话”的核心功能...
哪个品牌的吸尘器好?小型吸尘器... 不想做太多功课也没关系。我把十几台热门吸尘器都试过,把表现最稳的挑成这一份闭眼清单。每台都实际测了吸...
天基算力竞速赛:突破能源与带宽... 慧博投研近日发布研究报告,对太空算力这一前沿领域进行深度梳理。报告指出,太空算力指将数据处理与计算设...
小米:已拥有S级短剧1000部... 观点网讯:12月17日,小米互联网业务部总经理刘婵公开表示,小米互联网已构筑起真正意义上的全局生态,...
曝一加Turbo配备全新165... 【CNMO科技消息】12月17日,数码博主爆料称,一加即将推出的全新Turbo系列将打破传统“Tur...
徕芬i2电动牙刷:老用户7折换... 作为一名徕芬第一代电动牙刷的早期用户,我曾是这个国产新锐品牌的支持者。然而,当品牌推出第二代i2并打...
我国侵入式脑机接口临床试验取得... 12月17日,中国科学院脑科学与智能技术卓越创新中心发布该中心与国内科研机构及医疗单位合作开展的第二...
一次让轴组件“重生”的质量效率... 来源:滚动播报 (来源:中国航空报) 张博欣 在航空工业华燕精密制造中心的研磨间里,王松平盯着手...
存储成本上涨致中端设备涨价 头... 2025-12-16 15:01:39 作者:狼叫兽 此前有消息指出,部分在售的小米平板产品已出现...
智慧课程建设典型案例:知识图谱... 教育数字化的浪潮不可逆转,智慧课程正从单一的资源堆砌,转向构建能够“思考”和“生长”的有机体。智慧课...
小白怎么做公众号:1个月被推流... 公众号有没有推流,跟你什么时候发文章是没有关系的,相信很多人更想知道,腾讯的推荐机制到底是怎么样的?...
耗资43亿美元:美国宇航局罗曼... IT之家 12 月 17 日消息,科技媒体 Ars Technica 今天(12 月 17 日)发布...
引智借力,山区县变身成果转化“... 初冬的夜晚,位于浦城县的福州大学国家大学科技园(浦城)生物产业技术研究院里,福州大学生物科学与工程学...
荣耀“双响”,强音“三连”! 第983医院铸就硬核团队 康复医学科科普学术全面开花 近日,联勤保障部队第983医院康复医学科在科普...
狙击金融风险,山东有套“智慧审...   12月15日清晨,在山东省审计厅数据分析中心,大屏幕上跳动的数据流正实时监测着全省金融动态。这里...
原创 目... 文 |朝子亥 本文为深度观点解读,仅供交流学习 不知道为什么,听到印度要登月取回月壤的时候,就特别想...
原创 M... MLXG彻底败给RNG,已经被限制高消费,赔款金额高达2500万,RNG这支队伍,如今已经走到了一个...
五大金融机构赋能高新机器人产业 我市举办金融支持科创产业高质量发展对接会 五大金融机构赋能高新机器人产业 现场签约金额达1.02亿元...
“数聚北疆,智创未来”数据标注... 近日,为深化人工智能领域产教融合,搭建数据标注人才竞技与交流平台,助力内蒙古数字经济高质量发展,“数...