AI智能体遭遇责任壁垒,Mixus推出人工监督解决方案
创始人
2025-07-01 16:40:52
0

企业在关键应用中部署AI智能体面临挑战时,一种更加务实的新模式正在兴起,该模式将人类重新置于控制地位,作为防范AI故障的战略保障。

Mixus平台就是这样一个例子,它采用"同事参与式"方法,使AI智能体在关键任务中变得可靠。

这种方法是对越来越多证据表明完全自主智能体是高风险赌博的回应。

不受控制的AI成本高昂

随着企业探索AI应用,AI幻觉问题已成为实实在在的风险。在最近的一起事件中,AI驱动的代码编辑器Cursor的支持机器人虚构了一项限制订阅的假政策,引发了公众客户取消订阅的浪潮。

同样,金融科技公司Klarna在承认用AI替代客服代理导致服务质量下降后,著名地逆转了这一决定。在一个更令人担忧的案例中,纽约市的AI商务聊天机器人建议企业家从事非法活动,凸显了无监督智能体带来的灾难性合规风险。

这些事件反映了更大的能力差距。根据2025年5月Salesforce的研究论文,当今领先的智能体在单步任务上成功率仅为58%,在多步任务上仅为35%,突显了"当前大语言模型能力与现实企业场景多元化需求之间的显著差距"。

同事参与式模式

为了弥合这一差距,新方法专注于结构化的人工监督。Mixus联合创始人Elliot Katz告诉VentureBeat:"AI智能体应该按照你的指示并代表你行动。但没有内置组织监督的完全自主智能体往往会制造更多问题而非解决问题。"

这一理念支撑着Mixus的同事参与式模式,该模式将人工验证直接嵌入自动化工作流程中。例如,大型零售商可能每周收到来自数千家门店包含关键运营数据的报告(如销售量、工时、生产率比率、总部薪酬申请)。人工分析师必须花费数小时手动审查数据并基于启发式方法做决策。使用Mixus,AI智能体自动化繁重工作,分析复杂模式并标记异常情况,如异常高的薪资申请或生产率异常值。

对于支付授权或政策违规等高风险决策——用户定义为"高风险"的工作流程——智能体会暂停并要求人工批准后才能继续。AI与人类之间的分工已集成到智能体创建过程中。

"这种方法意味着人类仅在其专业知识真正增加价值时才参与——通常是可能产生重大影响的关键5-10%的决策——而其余90-95%的常规任务自动流转,"Katz说。"你在标准操作中获得全自动化的速度,但当上下文、判断和责任最重要时,人工监督会精确介入。"

在Mixus团队向VentureBeat展示的演示中,创建智能体是一个可以用纯文本指令完成的直观过程。例如,为记者构建事实核查智能体时,联合创始人Shai Magzimof简单地用自然语言描述多步骤过程,并指示平台在特定阈值处嵌入人工验证步骤,如当声明为高风险且可能导致声誉损害或法律后果时。

该平台的核心优势之一是与Google Drive、电子邮件和Slack等工具的集成,允许企业用户将自己的数据源引入工作流程,并直接从他们选择的通信平台与智能体交互,无需切换上下文或学习新界面。

平台的集成能力进一步扩展以满足特定企业需求。Mixus支持模型上下文协议(MCP),使企业能够将智能体连接到他们的定制工具和API,避免为现有内部系统重新造轮子。结合与Jira和Salesforce等其他企业软件的集成,这允许智能体执行复杂的跨平台任务。

人工监督作为战略倍增器

随着企业从实验转向生产,企业AI领域目前正在经历现实检验。许多行业领导者的共识是,人机协作对于智能体可靠执行是实际必要的。

Mixus的协作模式改变了扩展AI的经济学。该公司预测,到2030年,智能体部署可能增长1000倍,每个人工监督员将变得更高效50倍,但对人工监督的总需求仍将增长。

"随着时间推移,每个人工监督员管理的AI工作呈指数级增长,但随着AI在组织中爆炸式部署,你仍然需要更多总体监督,"Katz说。

对于企业领导者来说,这意味着人类技能将演进而非消失。专家们不会被AI取代,而是被提升到协调AI智能体舰队并处理标记给他们审查的高风险决策的角色。

在这个框架中,建立强大的人工监督功能成为竞争优势,允许公司比竞争对手更积极、更安全地部署AI。

"掌握这种倍增效应的公司将主导其行业,而追求完全自动化的公司将在可靠性、合规性和信任方面苦苦挣扎,"Katz说。

转自:至顶网

相关内容

热门资讯

宁波朗迪取得网布烫边切割装置专... 金融界2025年8月6日消息,国家知识产权局信息显示,宁波朗迪环境科技有限公司取得一项名为“网布烫边...
富兴塑膜取得PVC塑膜压纹成型... 金融界2025年8月6日消息,国家知识产权局信息显示,苍南县富兴塑膜有限公司取得一项名为“一种PVC...
美国拟2030年前在月球建成核... △艺术家描绘的月球上的电力系统。(图片来源:NASA) 当地时间8月5日,据多家美国媒体报道,美国交...
TTG3-1KSG,清清正反手... TTG3-1战胜KSG,终于结束了对KSG的连败。从EWC回来之后他们似乎变强了,清清证明了为什么萝...
中国电信视联网赋能基层治理 提... 近日,丰都县仁沙镇依托中国电信视联网技术,进一步提升基层治理智能化水平,推动乡村基层治理体系不断完善...
《上古OL》开发商被砍掉的《黑... 微软最近的大裁员砍掉了《上古卷轴OL》开发商备受期待的新IP(代号为黑鸟计划)以及Rare工作室的《...
山东科嘉电气:高效智能充电方案... 山东科嘉电气近日推出了两款创新充电设备,专为不同领域提供专业、高效、安全的充电解决方案。这些设备分别...
科技前沿丨普通家庭何时能用上保... 7月31日召开的国务院常务会议审议通过《关于深入实施“人工智能+”行动的意见》。会议指出,当前人工智...
泰科汽车取得油箱加油单向阀专利... 金融界2025年8月6日消息,国家知识产权局信息显示,芜湖泰科汽车科技有限公司取得一项名为“一种油箱...
当年吹爆Edge浏览器的我,现... 每位资深玩家,在对枪失败、团战暴毙后,都有一套神圣的仪式: “诶今天鼠标有点飘”、“这键盘键程不对”...
走出光伏同质化困境,BC生态圈... 来源:澎湃新闻 隆基绿能创始人、首席技术官李振国 同质化的红海厮杀,令光伏产业深陷恶性竞争泥潭。乘...
AL被打晕了?IG辅助抢大龙翻... ★游戏马蹄铁原创 AL对战IG第二局 IG无愧是现在LPL的人气王,流量王,他们的比赛不仅是明星选...
LOL:BLG被曝不是全华班,... Shadow护照是意大利的 在LPL赛区中,全华班自带流量和话题,像RNG、BLG这种主打全华班的...
紧盯AI人才,“鹅厂”招新,软... 8月6日,腾讯2026校园招聘正式启动。本次招聘面向2025年1月至2026年12月期间毕业的大学生...
DOTA2 7.39d 更新深... 当看到 7.39d 的更新日志时,我的第一反应是:这不是简单的数值微调,而是V社对当前版本生态的一次...
《仁王3》制作人访谈:保留硬核... 今年6月,《仁王3》发布了首支预告片,并宣布游戏将于明年年初正式发售,登陆PlayStation 5...
青春好市 | 以手抵心,对话千... 当棕榈叶在指尖翻飞成灵兽,当大漆在掌心打磨出光华,当破碎的古瓷片在你手中重获新生...这不是遥远的传...
IDC:Q2中国消费级游戏本市... IT之家 8 月 6 日消息,市场研究机构 IDC 今天发文,披露了中国消费级游戏 PC 市场的数据...
小米手机欧洲市场份额首超苹果,... 【太平洋科技快讯】8 月 6 日,小米集团合伙人、小米集团总裁、部总裁兼小米品牌总经理卢伟冰在社交媒...
王者荣耀:夏侯惇喜迎加强,亚连... 王者荣耀本赛季已经进入中期,还没有拿到王者印记的小伙伴确实该抓紧时间了,毕竟到了赛季后半段上分难度会...