号称“AI打工人”的OpenClaw,值得用吗?
创始人
2026-02-26 01:21:43
0

最近,号称能“接管电脑、解放双手”的AI Agent(AI智能体)工具——OpenClaw,在技术圈火得一塌糊涂。

OpenClaw被吹捧为“AI打工人”,似乎只要下个指令,它就能替你写文章、发邮件甚至买咖啡。但事实真的如此吗?它是生产力神器,还是仅供技术极客尝鲜的“玩具”?

近日,《每日经济新闻》记者联合每经科技开发人员,展开了一场深度实测。

《每日经济新闻》记者和每经科技开发人员将OpenClaw分别接入千问Qwen3-Max、月之暗面Kimi-K2.5、MiniMaxM2.1、MiniMax-M2.5和智谱GLM-4.7五款国产大模型,以及OpenAI的GPT-5-mini,要求它们完成本地文件检索、网络资料搜索、稿件撰写、发送邮件等步骤,试图通过这些测试揭开 OpenClaw的真实能力。

视觉中国图

实测结果显示,部分模型表现不佳,尤其是在需要操控浏览器的环节,如网络搜索和发送邮件,大多失败。有行业专家直言,当前的OpenClaw不仅难用、费钱,对于信息安全等,更有可能是一场“噩梦”。

实测对比:GPT-5、MiniMax、智谱完成任务 另两款“行动力”不足

OpenClaw本身并非大模型,它更像一个“指挥官”,负责接收用户指令、调用工具和组织流程,并将指令理解与具体工作交由其接入的外部大模型来完成。因此,接入的大模型的能力、稳定性与表达方式,决定了任务的最终成败。

为了更贴近《每日经济新闻》记者的真实工作场景,测试人员设定了一项综合性测试任务:让接入不同大模型的OpenClaw,在电脑中找到对“电车教父”Andy Palmer的采访速记稿,要求它总结文稿内容,并结合搜索到的网络资料,撰写一篇专访新闻稿,最后将新闻稿通过邮件发送到指定邮箱。

这一任务涵盖了指令理解、操控电脑进行本地文件检索、操控浏览器进行网络信息搜索、信息整合和文章写作以及应用操控等多个维度。

在首次测试中,各模型的表现分化显著。以下为首次测试结果:

● OpenClaw+千问Qwen3Max:首 先 测 试 的 是 千 问Qwen3-Max模型。该模型在本地文件检索环节便陷入困境。即便测试人员明确提示文件在电脑中的位置,Qwen3-Max在经过约5分钟检索后,仍无法准确定位。在后续单独测试其发送邮件任务时,Qwen3-Max也未能成功执行,只是不断重复指令,但无实际动作。

● OpenClaw+月之暗面Kimi-K2.5:Kimi-K2.5的表现稍好,它在5分钟内成功检索到了文件,并完成内容总结。但在执行网络搜索并补充行业最新热点资讯时,因触发了“429错误”(通常指请求过于频繁),导致未能完成信息搜索工作。在邮件发送环节,Kimi-K2.5无法成功操控浏览器向指定邮箱发送邮件。

● OpenClaw + MiniMaxM2.1:MiniMax-M2.1在文件检索、网络搜索资料和写作方面没有遇到明显阻碍。邮件发送环节,MiniMax-M2.1在浏览器操控上遇到了困难,但并未就此卡住,而是主动给出了一个可行的解决方案。测试人员根据其提示手动操作后,成功解决了问题,使其最终能够发送邮件。不过,MiniMaxM2.1发送的邮件只包含了稿件的“关键引语”,未附上完整的稿件正文。

● OpenClaw + MiniMaxM2.5:虽然都是MiniMax旗下模型,2月12日发布的MiniMaxM2.5,表现比MiniMax-M2.1更好,不仅顺利完成文件检索、网络搜索资料和写作,在发送邮件环节也无需人工介入。

● OpenClaw +智谱GLM-4.7:由于OpenClaw暂未接入智谱于2月12日发布的最新模型GLM-5,所以,本次测试选择了智谱GLM-4.7。结果显示,在发送邮件环节,智谱GLM-4.7会在浏览器中输入错误的邮箱网址,导致网页访问失败,需要人工提醒更正。除此之外,智谱GLM-4.7在其他环节处理速度较快。

● OpenClaw + GPT- 5mini:GPT-5-mini的表现较为稳定和流畅。从文件检索、内容总结、网络搜索、资料补充到邮件发送,全流程几乎无需人工干预和额外提示,仅在个别时候出现了网络连接不稳定的情况。

为了保证测试的严谨性,测试人员对整个流程进行了两次复测。

以下为第二轮测试结果:

● OpenClaw+月之暗面Kimi-K2.5:成功检索并读取本地文件,补充网络搜索资料,但在邮件发送环节依旧失败。其报告的错误显示,在读取邮箱网络代码、获取输入框节点时出现问题。

● OpenClaw+千问Qwen3Max:成功读取文件并补充网络资料,但在邮件发送环节出现明显卡顿,未能成功。

● OpenClaw + MiniMaxM2.1/2.5:完成任务全部流程。

● OpenClaw+智谱GLM-4.7:完成任务全部流程。

● OpenClaw + GPT- 5mini:完成任务全部流程。

以下为第三轮测试结果:

● OpenClaw+月之暗面Kimi-K2.5:成功检索并读取本地文件,在网络搜索资料环节出现问题(出现读取网页内容错误,错误的网站访问路径,理解不了浏览器控制台指令等),在邮件发送环节依旧失败。

● OpenClaw+千问Qwen3Max:成功读取文件,但无法操控浏览器搜索网络资料,在邮件发送环节依旧失败。

● OpenClaw + MiniMaxM2.1/2.5:完成任务全部流程。

● OpenClaw+智谱GLM-4.7:完成任务全部流程。

● OpenClaw + GPT- 5mini:完成任务全部流程。

业内视角:OpenClaw能力上限取决于大模型 尚未成为合格生产力工具

日前,《每日经济新闻》记者对一些业内人士和资深用户的采访情况,也一定程度上印证上述测试结论。

一名使用OpenClaw来辅助运营网店,设计海报和优惠券等宣传物料的程序员告诉《每日经济新闻》记者,其平时都是接入OpenAI的Codex-5.3和Gemini3 Pro模型,效果比国产大模型好很多。

多位业内人士和资深用户指出,OpenClaw更像一个“任务框架”,其最终表现非常依赖所接入大模型的能力,就像一个指令清晰但能力有限的指挥官,手下士兵(即大模型)的强弱,直接决定了战役的胜败。

非凡产研研究负责人宦家臣向《每日经济新闻》记者表示,“模型对OpenClaw的影响,其实取决于任务的复杂程度。国际头部大模型上限更高,但是如果都是普通任务,国内的智谱GLM-4.7、Kimi-K2.5都很不错,毕竟Claude太贵了,钱包受不了。”

尽管部分大模型在测试中展现了执行复杂任务的潜力,但OpenClaw离成为一款合格的生产力工具,似乎还有不小的距离。

“我感觉,目前版本的OpenClaw并不是一个合格的生产力工具。”在接受《每日经济新闻》记者采访时,前小米OS AI产品专家、现出海AI应用公司ExcelMaster.ai创始人张和直言,OpenClaw在一定程度上是此前爆火的程序员工具——Anthropic旗下Claude Code的“套壳”,虽然通过聊天界面和内置技能(Skill)做了更好的封装,降低了交互门槛,但在核心能力上并未超越。

“我没找到太多OpenClaw能做,而Claude Code做不了的事情。并且,OpenClaw查询资料的水准,也没有Claude Code好。”张和进一步表示。

“等大模型能力再跃升一点,OpenClaw就会越来越好,就会越来越普及。哪怕它什么都不做,就等着更新的大模型出来……OpenClaw的门槛就会降低。”张和强调,OpenClaw的进步与普及,本质上是在等待底层大模型技术的突破。

Akamai云和AI产品经理张璐博士也表达了相似的观点。在张璐博士看来,OpenClaw若要真正用于生产,还必须经过二次开发和微调,因为目前版本还“有点不成熟,很多时候会卡顿”。

用户体验:高门槛、高成本和高风险劝退普通用户

《每日经济新闻》记者还了解到,除了对大模型能力的依赖,技术门槛、使用成本和安全风险也让OpenClaw目前难以走向普通用户。

首先是较高的部署和使用门槛。目前,OpenClaw并未提供类似“一键安装”的简化部署方案,用户需要在电脑上通过命令行操作,完成本地配置、依赖管理以及权限设置。

每经科技开发人员表示,整个过程对使用者的技术背景有一定要求,至少需要具备基本的开发经验,这无疑劝退了绝大多数非技术人员。虽然阿里云、腾讯云、亚马逊云等云厂商都提供了OpenClaw云端部署服务,并声称可以在其配置好的服务器上便捷部署OpenClaw,但在云端部署的OpenClaw,并不能提供操控用户本地电脑的能力。

高昂的使用成本是另一个现实问题。由于OpenClaw在执行任务时需要频繁调用大模型,token(令牌/词元,是计算机领域的数字标识符)消耗量巨大,堪称“token燃烧器”。

有用户向《每日经济新闻》记者表示,其使用智谱GLM-4.7模型,仅仅交互了20多次,就花费了200元。

张璐博士也提到,其在使用DeepSeek(深度求索)模型时,一天就“烧掉”几十元。如果换成能力更强的模型,账单将更惊人,“一天几百元就出去了”。

高成本使得许多用户只能选择接入免费或更便宜的大模型,但这又会影响OpenClaw的实际表现。 有用户向《每日经济新闻》记者反映,其因成本问题选择了Qwen-8B模型,但OpenClaw总是只会回答问题,不会执行操作。

《每日经济新闻》记者了解到,比高门槛和高成本更令人担忧的是其内在的安全风险。OpenClaw的定位是“做事”而非“聊天”,这意味着它必须获得很高的系统权限,才能操控本地文件和应用。

思科AI威胁研究与安全团队主管Amy Chang直言,从安全角度来看,OpenClaw“是一场噩梦”,它可以在用户的计算机上任意运行shell命令、读写文件和执行脚本。这种高级权限一旦被错误配置或被恶意指令利用,后果不堪设想。

网络安全公司Dvuln的创始人Jamieson O'Reilly也证实存在这种风险。Jamieson O'Reilly发现OpenClaw存在漏洞,攻击者可借此获取用户数月内的私人消息、账户凭证、API密钥等敏感信息。更可怕的是,用户为了方便AI执行任务而存储的银行账户、加密货币钱包API等信息,都可能以明文形式保存在本地文件中,一旦被黑客入侵,“一秒就可以搬空用户”。

OpenClaw的开发者Peter Steinberger也坦言,这只是一个免费的开源业余项目,需要用户进行仔细的配置才能确保安全。Peter Steinberger明确表示:“它并不适合非技术用户。”

(每经科技骆方平对本文亦有贡献)

每日经济新闻

相关内容

热门资讯

新春开工忙 起步即起势 新春伊始,佛山制造业吹响高质量发展冲锋号。从传统家居卖场到智能机器人园区,佛山企业正以饱满的热情、扎...
非晶化材料可实现钠离子电池快充... 来源:兵团日报 ●韩荣 钠离子电池凭借原料丰富、成本低廉、安全性高的优势,被视为大规模储能、低温动力...
峰飞航空:将在岳阳市设立湖南区... 中证报中证网讯(记者 乔翔)2月25日,峰飞航空2吨级eVTOL(电动垂直起降飞行器)与零碳水上机场...
号称“AI打工人”的OpenC... 最近,号称能“接管电脑、解放双手”的AI Agent(AI智能体)工具——OpenClaw,在技术圈...
广州黄埔:低空经济“飞”出新高... 来源:中国新闻网 中新网广州2月25日电 (张璐 许婉)位于广州市黄埔区九龙湖公园的汇天全国首个飞行...
以旧换新“焕新”消费图景 智能... 本报记者 许林艳 在北京市朝阳区的一家华为专卖店内,店员正在熟练地操作线上评估系统,对消费者晓慧的旧...
春晚XR再破圈,从“炫技”走向... 引言 当《马上有奇迹》中虚实相生的骏马冲破舞台边界,《贺花神》的幻境在数字实景中铺展四季芳华……20...
职教学子入企问需 银杏酚酸破题... 为将课堂所学对接产业一线,推动科技创新成果真正服务于农业绿色高质量发展,近日,铜仁职业技术大学“杏绘...
消息称魅族手机业务实质性停摆,... 2月25日,据界面新闻、每日经济新闻等媒体报道,魅族手机业务已经实质性停摆,将于2026年3月正式退...
中银国际:AI大模型演进路径逐... 来源:市场资讯 (来源:智通财经) 智通财经APP获悉,中银国际发布研报称,2026年春节前后,国内...
诺比侃AI为轨交运维保驾护航 诺比侃凭借领先的轨道交通AI检测解决方案,为全国铁路网络筑牢“智能安全屏障”,助力春运高效畅通。 作...
天翼云科研助手:以息壤为基,赋... 在科研创新进入算力驱动的新时代,科研软件作为数据处理、模型运算、成果转化的核心工具,其性能与适配性直...
神州VR科普·一起“趣”阅读|... 恐龙是生活在距今大约 2亿3500万年至6500万年前的中生代动物, 在6500万年前白垩(è)纪结...
拜年海报出现“脏话”,腾讯元宝... 元宝又“骂人”了? 最近,有网友在社交平台分享一则今年春节期间的经历——使用元宝生成个人拜年海报,但...
科莱堡取得透明耐高温单向阀专利... 国家知识产权局信息显示,漯河科莱堡科技有限公司取得一项名为“一种透明耐高温单向阀”的专利,授权公告号...
概念研究所-什么是灵巧手? 春晚人形机器人的爆火,进一步印证了人形机器人产业从实验室技术突破向产业化应用或已有关键进展。在机器人...
摩尔线程申请图像处理方法及装置... 国家知识产权局信息显示,摩尔线程智能科技(北京)股份有限公司申请一项名为“图像处理方法及装置、电子设...
联播+|三个“桩”撑起“一盘棋... 2月9日,正值早春时节,在位于北京亦庄的国家信创园区,一场关于未来的对话正在进行。园区一层大厅里,与...
上海交通大学首创循证推理诊断系... 中国教育报-中国教育新闻网讯(记者 任朝霞)日前,由上海交通大学人工智能学院张娅教授、谢伟迪副教授与...
原创 W... LPL新的大战已经开打,相信网友们也看得很开心,一上来JDG和TES就给网友们带来了节目效果,笑到最...