上证报中国证券网讯(记者 孙小程)6月9日,记者自面壁智能获悉,该公司于近日发布新一代端侧基座模型MiniCPM4.0,让长文本、深思考在端侧真正跑起来。MiniCPM4.0拥有8B、0.5B两种参数规模,其中MiniCPM4-8B“闪电稀疏版”采用了新一代上下文稀疏高效架构。 针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B采用“高效双频换挡”机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。 与此同时,MiniCPM4.0进一步实现了长文本缓存的大幅锐减,在速度、性能提升的同时,又做到了模型极致压缩,减小端侧算力层面的压力。 在应用上,基于8B版本,团队微调出两个特定能力模型,分别可以用做MCPClient和纯端侧性能比肩MiniCPM4-Surve。 面壁智能也携手诸多行业伙伴,持续推动MiniCPM4.0模型适配及应用拓展。截至目前,MiniCPM4.0已实现Intel、高通、MTK等芯片的适配。此外,MiniCPM4.0可在vLLM、SGLang、llama.cpp、LlamaFactory、XTuner等开源框架部署。同时面壁智能加强了对MCP的支持,进一步拓展了模型开发、应用潜力。 截至目前,面壁小钢炮MiniCPM系列全平台下载量累计破1000万。面壁智能相关负责人表示,未来面壁智能还将基于“大模型密度定律DensingLaw”,持续提高大模型的知识密度与智能水平,推动端侧智能高效发展与规模化产业应用。
上证报中国证券网讯(记者 孙小程)6月9日,记者自面壁智能获悉,该公司于近日发布新一代端侧基座模型MiniCPM4.0,让长文本、深思考在端侧真正跑起来。MiniCPM4.0拥有8B、0.5B两种参数规模,其中MiniCPM4-8B“闪电稀疏版”采用了新一代上下文稀疏高效架构。
针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B采用“高效双频换挡”机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。
与此同时,MiniCPM4.0进一步实现了长文本缓存的大幅锐减,在速度、性能提升的同时,又做到了模型极致压缩,减小端侧算力层面的压力。
在应用上,基于8B版本,团队微调出两个特定能力模型,分别可以用做MCPClient和纯端侧性能比肩MiniCPM4-Surve。
面壁智能也携手诸多行业伙伴,持续推动MiniCPM4.0模型适配及应用拓展。截至目前,MiniCPM4.0已实现Intel、高通、MTK等芯片的适配。此外,MiniCPM4.0可在vLLM、SGLang、llama.cpp、LlamaFactory、XTuner等开源框架部署。同时面壁智能加强了对MCP的支持,进一步拓展了模型开发、应用潜力。
截至目前,面壁小钢炮MiniCPM系列全平台下载量累计破1000万。面壁智能相关负责人表示,未来面壁智能还将基于“大模型密度定律DensingLaw”,持续提高大模型的知识密度与智能水平,推动端侧智能高效发展与规模化产业应用。