近日,西安电子科技大学计算机科学与技术学院沈玉龙教授团队在密码大模型方面取得突破性进展。研究成果以“玄知大模型”命名在西部网络安全大会上正式发布。
2025年8月15日,第四届西部网络安全大会在陕西周至召开。西安电子科技大学计算机科学与技术学院沈玉龙教授团队发布了一款全球首个面向密码学领域的大语言模型——玄知大模型(CryptoLLM)。该模型的发布标志着密码学进入智能化发展新阶段,为密码算法分析、协议设计与工程实现提供了全流程的智能支持,开启密码学AI应用新纪元。
大会现场(西安电子科技大学供图)
玄知大模型由西电NSS实验室沈玉龙教授团队研发,基于国产开源大模型构建,融合超百亿级密码学专业数据与分阶段精调策略,在三大关键能力上实现突破:密码算法智能分析:自动识别算法缺陷,辅助安全性验证与漏洞定位;密码协议智能设计:支持协议设计与安全推理,提升协议生成效率与质量;密码工程高效实现:实现密码库集成、自动代码生成及部署优化。
当前,全球密码技术竞争已上升至国家战略博弈层级,直接关乎国家安全、科技话语权乃至未来国际秩序重塑。掌握密码核心技术,即掌握数字时代的主导权。传统研究范式已难以应对快速演进的安全威胁。
西安电子科技大学作为我国密码学研究的发源地,拥有军外唯一国家级密码学重点学科,被誉为“密码学黄埔军校”,为国家培养大批顶尖人才。传承先辈使命,西电NSS团队以玄知大模型为支点,肩负起智能时代密码学创新的历史责任,推动密码技术从“护卫国家安全”向“赋能数字文明”跨越。
发布现场(西安电子科技大学供图)
为打造玄知大模型的核心竞争力,团队组建超百人专项数据工程组,历时6个月攻坚,建成规模达50Btokens的垂直领域知识池——全面覆盖密码学权威著作、顶会论文、开源协议库、算法代码库及技术博客等多元高价值数据源。
团队自主研发全栈式数据处理平台,实现多模态数据的深度结构化解析:论文智能解析系统:精准提取公式、图表及算法描述语义,突破非结构化数据处理瓶颈;代码知识蒸馏引擎:自动构建调用链拓扑,完成安全关键点的形式化验证; 跨模态语义对齐:实现文本、代码、数学符号的联合表征建模。
基于此构建的千万级精标指令数据集,通过双轮人工校验机制,确保指令集兼具场景覆盖广度与专业认知深度,为模型训练提供高价值知识基座。
在模型训练中,基于国产开源千问2.5通用模型,采用了分阶段微调策略。该策略通过四个递进阶段:沉淀行业知识、淬炼行业技能、对话交互增强、强化人类偏好,全面提升了模型在密码学领域的通用能力基础,并在特定密码任务上达到专家级水平。最终模型不仅能精准解析密码学专业语言,更能进行类人推理、设计与优化,为密码学领域提供强大的智能解决方案。
西安电子科技大学同步发布全球首个密码学专业测评基准CryptoBench,填补领域空白。该基准覆盖密码算法/协议/工程三大板块、12个核心方向、74个细分领域,包含10,000+道精编题目,实现能力边界精准探测。建立版本迭代流程,持续适配密码技术演进需求。
在权威测评基准CryptoBench的全面评估中,玄知大模型(CryptoLLM)展现出全球领先的密码学专业能力:其综合性能超越当前最优模型GPT-4o达8.8%,并在密码算法分析(+8.6%)、协议设计(+6.8%)、工程实现(+5.1%)三大核心维度全面领先GPT-4o、Claude4.0、Gemini2.5等国际顶尖产品。
在对称加密、安全模型证明等12个细分方向中的11项显著优于国际竞品。值得注意的是,该成果基于仅32B参数的国产基座模型实现,验证了专领域深度定制,能够带来小领域中质的飞跃。
玄知大模型聚焦密码工程实际应用,面向产业界提供开放API与SDK工具包,显著降低密码技术应用门槛。模型已支持在安全多方计算、隐私计算等核心领域广泛应用。(西安电子科技大学供稿)