联合实验室专家陈建洪:打造AI伦理研究与实践国际高地
创始人
2025-09-16 20:02:30
0

生成式人工智能是引领新一代科技革命和产业革命的核心驱动力,是加快培育和发展新质生产力的重要引擎,为经济高质量发展注入新动能,与此同时,各类难以预知的风险和挑战也伴生而来。

安全是发展的基石,为进一步创新筑牢根基。2025年9月15日,粤港澳大湾区生成式人工智能安全发展联合实验室揭牌成立。其将构建“政产学研用”深度融合的创新生态,致力服务企业发展、推动产业落地、加强安全监管,努力实现属地企业安全合规成本全国最低、安全能力水平全国领先,助力粤港澳大湾区成为全国生成式人工智能安全发展服务最优区域。

南方都市报、南都大数据研究院推出“湾区AI安全发展新引擎”系列报道,深度对话参与联合实验室建设的专家,一同憧憬大湾区AI安全发展新未来。

“联合实验室将成为国际合作的重要窗口,积极参与全球AI治理对话,提升区域在全球的影响力。”中山大学哲学系(珠海)主任、博雅学院院长,联合实验室专家陈建洪接受南都采访表示,哲学研究能为AI伦理规范提供深层基础,哲学视角能提醒技术团队坚守增进人类福祉原则,而非取代人类价值。

哲学能深入理解AI风险本质

南方都市报(以下简称“南都”):本次粤港澳大湾区生成式人工智能安全发展联合实验室汇聚了各学术领域、学科的专家,您作为哲学领域的专家,觉得哲学相关的研究能为实验室的治理体系建设提供哪些独特支撑?

陈建洪首先是价值观与伦理原则的构建。哲学研究能够深入探讨人类社会的根本价值观,如公平、正义、尊严、自由等,为AI伦理规范提供深层基础。它将有助于联合实验室明确生成式AI发展的终极目的和应遵循的基本原则,避免技术盲目发展,例如思考“公平”的AI模型应具备哪些属性。

其次是风险的本质与边界界定。哲学能帮助我们超越技术层面,深入理解AI风险的本质(如是技术缺陷、使用方式问题还是社会结构互动结果),并界定可接受的风险边界,以及如何在创新与风险之间进行权衡取舍。例如,对“可解释性”的哲学探讨可避免过度约束技术发展。

最后是责任分配与主体思考:随着AI能力增强,传统责任概念面临挑战。哲学研究能深入探讨“谁该负责”的问题,包括开发者、使用者、管理者乃至AI系统自身(作为有限主体性),并强调人类在AI发展中的主体地位,确保AI始终服务于人类福祉。

南都:在您看来,哲学视角可在哪些维度和技术治理互相补充?

陈建洪:第一,超越技术可行性的伦理审查。技术团队常关注“能否做到”,哲学视角则引入“应不应该做”的考量。在AI模型迭代、内容审核等环节,哲学伦理审查节点可引导技术团队预判社会危害和伦理风险,在研发初期就进行规避或设计限制。

第二,社会影响的预判与评估。技术治理侧重技术指标,哲学视角引导技术团队更全面思考AI对社会、文化、经济乃至个人心理健康的深远影响,促使其在设计之初就融入社会影响评估,并通过技术设计促进积极社会效应。

除此之外,公平与公正的价值嵌入也很重要。技术团队难以直接在代码层面体现抽象公平概念。哲学视角可将公平、无偏见等伦理原则转化为具体的研发规范和设计策略,例如在数据选择时强调多样性和代表性,在算法设计时鼓励偏见检测和缓解机制。

最后就是增进人类福祉的坚守。哲学视角能提醒技术团队坚守增进人类福祉原则,确保AI工具服务于人类尊严、自主和福祉,而非取代人类价值。这意味着在技术设计中,要保留人类的最终控制权和决策权,强调AI作为人类辅助的角色。

建立系统性偏见检测与缓解流程

南都:据了解,联合实验室将制定行业安全发展标准,形成属地化安全标准体系。如何平衡标准的严谨性与产业发展的灵活性,满足大湾区多元产业结构的需求?

陈建洪:为平衡标准的严谨性与产业发展的灵活性,实验室可采取以下策略:首先,实施分级分类管理,依据风险等级和应用场景差异,对高风险领域制定强制性标准,对低风险领域采用灵活指导原则。其次,设立“监管沙盒”机制,允许企业在受控环境中测试创新应用,为标准完善提供实践依据。再次,推进行业自律与最佳实践,鼓励行业协会制定快速响应市场的专业指引,作为官方标准的有益补充。最后,建立动态更新与迭代机制,通过常态化评估和修订,确保标准体系具备前瞻性和适用性,适应技术快速发展。

南都:语料库作为生成式AI的“知识基础”,其价值导向直接影响AI生成内容的伦理边界。您认为联合实验室应建立怎样的语料库筛选与审核机制?

陈建洪:联合实验室应建立多层次的语料库筛选与审核机制,其核心原则包括:确保语料库的多元性与代表性;建立系统性偏见检测与缓解流程;实现价值观对齐;并严格遵守数据安全与隐私保护法规。具体机制涵盖:实施数据来源严格审查与白名单准入制度;采用自动化技术与人工审核相结合的双重筛选流程,由多学科专家团队对高风险内容进行复审;开发科学的偏见评估指标与度量体系,并定期发布审计报告;引入“红队”测试进行价值观对齐的压力测试与持续迭代;整合用户反馈与众包机制;并特别注重大湾区地域文化与行业特点的融入,邀请领域专家参与审核,确保AI的适应性与准确性。

期待形成“大湾区AI伦理范式”

南都:在您看来,联合实验室接下来的建设运行还有哪些方向?

建洪对联合实验室的建设运行主要有四方面期待。一是将其打造为AI伦理研究与实践的国际高地,通过设立专项,系统研究并输出可操作的伦理准则与治理框架,形成具有国际影响力的“大湾区AI伦理范式”。二是构建深度融合的“产学研用”生态圈,与顶尖高校及产业界紧密合作,开展科研、人才培养及行业应用示范,推动AI安全与伦理的落地实践。三是赋能区域并影响全球,通过输出高标准的安全解决方案和可推广的“大湾区经验”,助力企业提升竞争力,并积极参与全球AI治理框架制定,贡献中国智慧。四是建设开放共享的AI安全知识与资源中心,通过构建知识库、测试平台及开源数据集,降低研发门槛,激发创新活力,提升全球AI系统的安全性与可信度。

同题问答

在您看来,粤港澳大湾区生成式人工智能安全发展联合实验室能发挥哪些独特作用?

陈建洪:粤港澳大湾区生成式人工智能安全发展联合实验室将作为技术创新的核心引擎,通过汇聚顶尖科研资源,致力于生成式AI的前沿突破与应用转化。联合实验室聚焦安全标准制定,构建符合国际水平且适应本地实际的安全规范体系。同时充当产学研用协同交叉的桥梁,促进知识共享与技术转移,加速AI技术落地。作为高水平AI人才培养基地,输送兼具技术能力与伦理法律视野的专业力量。依托大湾区区位优势,成为国际合作窗口,积极参与全球AI治理对话,提升区域影响力。

监制:戎明昌 刘江涛

策划:王卫国 邹莹

统筹:凌慧珊 李伟锋 陈实 付可 关健明

撰文:南都研究员 李伟锋 孔令旖 唐静怡 陈袁 谢小清

南都N视频记者 熊润淼 袁炯贤 伍曼娜 曾俊豪

视频:陈杰豪 赵炎雄 冷锋

视效:AI数据工作室 张许君 郭文哲 原毅

设计:林泳希 尹洁琳 蔡沐晗 严丽萍

实习生:朱恺熙 程佳丽

出品:南都大数据研究院

相关内容

热门资讯

aiXcoder:企业级软件开... 12月24日,硅心科技(aiXcoder)产品研发负责人黄宁在行业会议上表示,当前流行的Vibe C...
(侨乡故事)为新疆水而生的人 德蓝水技术股份有限公司董事长曾凡夫子在新疆深耕水处理技术30年,致力于解决当地严峻的缺水问题。 他带...
《洛奇》遗忘之渊 冷酷君主 冷酷君主缓步踏上深渊王座,冷酷为其冠名。那套为统治而生的盔甲下低鸣,缠绕在盔甲之下的铁链雨刀刃装饰,...
郑州市管城回族区南关小学:咏梅... 大象新闻呢记者 高彦均 通讯员 曹磊/文图 晨光熹微,初心如炬。为传承红色经典文化,致敬伟人精神,1...
【智汇讲堂】资本项目业务系统用... 来源:市场资讯 (来源:智汇大叔) 资本项目业务系统 解决方案:请检查是否使用的是谷歌(109.0....
原创 半... 作为MMO界产能嗷嗷叫,最能变革的网游,《逆水寒》在2025年推出的“极品全靠爆、黄金服,到底咋样了...
南工大团队三项原创性突破让群体... □ 本报记者 谢诗涵 通讯员 朱琳 无人机表演、工业协同与智能交通等场景正依托群体智能技术走向现实,...
原创 T... T1去越南参赛,女主持念错AD名字,赛后哭着下跪道歉,近日,T1战队前往越南参加表演赛的一段小插曲,...
时评 | “体育外卖”只是“智... 近日,新华社报道了被称为“体育外卖”的上门体育培训服务,正在中国部分城市悄然走红的消息。 文中以昆明...
给AI接上专有知识库:RAG的... 文 | 沈素明 想象一个场景。 一家制造企业花费了数十万的预算,接入了市面上最先进的大语言模型(L...
国产GPU造富狂欢:谁是最大赢... 文 | 市值榜,作者 | 小戎,编辑 | 嘉辛 进入2025年的最后一个月,两只GPU股摩尔线程和...
欧盟《生物技术法案》正式发布 来源:市场资讯 (来源:中化新网) 核心:打通“实验室创新到市场化应用”关键链路 中化新网讯 12月...
原神苦熬五年登顶P站,3D区却... 米哈游花了五年时间,把《原神》推上了全球最大18+网站P站的电子游戏搜索榜榜首,终结了《堡垒之夜》的...
原创 魔... 盘点魔兽世界TBC太阳井高地公认最强的五大极品,万年TBC年代初期能拿下的才是真大佬,速看! 一:灰...
三一重能SI-242系列南方山... 来源:市场资讯 (来源:风芒能源) 12月,三一重能SI-242系列南方山地区域首个商业批量运行项...
上海勘测设计研究院取得海上风机... 国家知识产权局信息显示,上海勘测设计研究院有限公司取得一项名为“一种海上风机结构模态参数自动化识别方...
与石景山区人民政府签约!央广总... 12月23日,中央广播电视总台北京总站与北京市石景山区人民政府合作框架协议签约活动在京举行,总台超高...
以赛促学育英才 赋能智能产业新... (来源:天津日报) 转自:天津日报 近日,天津市2025年“海河工匠杯”技能大赛“服务机器人应用技...
原创 全... 前几天,有媒体报道称,在日本,“苹果税”(佣金)也降了,App内购调整至10-21%,同时放开了侧载...
亚马逊Alexa+重磅升级:让... 在科技日新月异的今天,亚马逊再次引领潮流,宣布其人工智能助手Alexa+将在2026年迎来重磅升级,...