你是一个成熟的Agent了,该自己报道ChatGPT Agent的新闻了
创始人
2025-07-18 20:25:48
0

作者 | 黄小艺邮箱 |huangxiaoyi@pingwest.com

7月18日凌晨,OpenAI发布了ChatGPT Agent,这是继1月份推出operator,2月份推出deep research之后,OpenAI在Agent化道路上又一关键举动。

当下,一个有趣的现象出现了:AI Agent领域正悄然分化为两大流派。一方是以OpenAI、Claude为代表的“基座派”,正在将Agent能力融入其底层模型;另一方则是“应用派”,强调自己在具体的应用场景和灵活的工具调用上的设计规划。

3月,Manus的横空出世,便已点燃了通用Agent的第一波市场狂潮,随后,Genspark、Flowith、Fellou等一众新锐玩家纷纷从不同应用场景切入,迅速在Agent赛道上形成了各自的阵营。

就在OpenAI发布ChatGPT Agent后不久,Genspark便在社交平台X上公开“叫板”,直言视频中演示的ChatGPT Agent能力“表现不够出色”。Manus也贴脸开大,对比了自己和OpenAI展示的案例的结果。

我们也想对比一下这些产品在ChatGPT Agent展示的一些案例上究竟表现有何不同。

1

你是一个成熟的Agent了,你该自己报道Agent的新闻了

首先,今天的AI Agent产品这么热闹,我们觉得它们也都是成熟的Agent了,应该来自己报道其他Agent的新闻了。

于是我们让几个备受关注的AI Agent产品来报道此次ChatGPT Agent的发布。我们并没有选择只是给一个很简单Prompt的方式,而是用类似深度报告的方式来要求它们,最终产出一个有些设计要素在的one pager。

结果如下。

Manus:

有意思的地方是,Manus的Agent自己分析之后,并没有像官方X账号那样“自信”,给了OpenAI更高的分数。

Genspark:

生成了一个更复杂的报告。这个报告里对OpenAI ChatGPT的信息捕捉更全。

并输出了一份非常详细的对比。

同样,与官方X的“自信”也不同,Genspark的Agent也对OpenAI的水平表达了高度认可。

Flowith:

Flowith算是对我们比较长的Prompt做了充分理解后,抓住了要做一个one pager这个重点,这让它的结果看起来设计感也最强,交出了一个格式上更好看的one pager。

1

比一比:从规划到执行的“最后一公里”

在报道完ChatGPT Agent后,我们让这些AI Agent也拿OpenAI视频展示的案例练了练手。互相比较一下。

OpenAI视频中提到了四个案例,主要是行程策划、图像设计类、资讯分析类,这也是自3月份Manus推出之后比较常见的场景。

我们先找了其中一个,婚礼规划的场景,把视频中展示的Prompt提交给了Manus、Genspark、Flowith、Fellou等,看看直接对比。

Manus:

https://manus.im/share/iWutNt1yTVXu8ZUTuz6YVQ?replay=1

Manus输出了一个长文本页面,没有给到具体购买链接等涉及到下一步行动的结果,属于婚礼参加指南和建议。

特别是着装要求上,没有具体的图片和款式。

Flowith:

同样给出了一份详细的婚礼参与指南,无法进行到下一步加购等动作,更关键的是,因为单开了一条任务线来挑选参加婚礼的服饰,该任务线出现bug,最终没能输出服饰结果。

Fellou:

Fellou居然为这个任务一口气跑了1 小时 14 分钟。这是一个很有意思的不同,OpenAI此次发布后,它的研究员也提到,应该有一个榜单来比较AI Agent一次任务能够跑的时长。

当然,这个时长和最终效果之间的关系也需要进一步查看。但Fellou这个操作还是给用户带来某种微妙的“靠谱”感。

这个过程它非常认真的单开了很多浏览器,比较行程、路线、酒店事件和日期。

最终它把信息用一种经过简单设计的格式,提供给用户。

但是在具体推荐上,同样无法直接购买,没有具体链接,只能输出报告,更像是一个搜集信息的AI浏览器。

https://chat.fellou.ai/report/0d853b10-fcd0-4c22-a1f2-696556c8f277

第二个我们选了“做贴纸”的场景。

贴纸的设计在近三个月来各类Agent测试中算是非常简单的了,而且,很多产品,例如Genspark的任务,本身也是调取的GPT的生图能力。

不过同样的,和OpenAI展示的相比,多个产品在订购环节,因为没有调用能力,无法完成具体操作。

比如Genspark会提示:很抱歉,我无法直接为您完成在线订购,因为这需要您的个人信息、付款方式和账户验证。不过我可以为您提供详细的订购指导,让整个过程变得超级简单!

Flowith同样只能进行订购指引。

在这个任务中,Manus在流程中显示完成了购物车的添加,也是除了OpenAI以外唯一一个进行到这一步的Agent。

相关内容

热门资讯

桂林鸿程取得外置卧式多头分级机... 国家知识产权局信息显示,桂林鸿程矿山设备制造有限责任公司取得一项名为“一种外置卧式多头分级机”的专利...
真的建议你睡前关掉WiFi,不... 它几乎存在于每个家庭 还常年不断电 没有它你可能还会焦虑 它,就是WiFi路由器 据中国新闻网报道 ...
小米17:旗舰机市场销量领跑,... 在2025年的旗舰机市场,小米17系列以破竹之势席卷而来,不仅销量数据屡创新高,更以“技术普惠”的理...
昆明文理学院举办“AI赋能语言... 近日,“AI赋能语言教学与国际传播”研讨会暨云南教育国际交流协会民办高校专家委员会第三次会议在昆明文...
建霖健康取得易于更换滤芯的装置... 国家知识产权局信息显示,厦门建霖健康家居股份有限公司取得一项名为“一种易于更换滤芯的装置”的专利,授...
有色金属行业积极推动人工智能大... 从过去采矿凭经验到如今实现智慧勘探,从昔日冶炼靠手艺到如今实现AI精准调控,从以往粗放加工到如今大数...
原创 越... 越南开国功臣武元甲晚年说:若非黎笋固执,中越根本不用打那一仗。这话一出来,不知道戳中了多少经历过那段...
申彦通讯取得丝印定位工装专利,... 国家知识产权局信息显示,上海申彦通讯设备制造有限公司取得一项名为“一种丝印定位工装”的专利,授权公告...
浦东具身智能企业跻身全球第一梯... 来源:市场资讯 (来源:上观新闻) 12月26日,浦东具身智能企业——艾利特机器人发布全新复合机器人...
俄罗斯团体评年度热词 “拉布布... 新华社莫斯科12月28日电(记者栾海)临近岁末,俄罗斯多家团体评选出本国2025年度热词,“胜利”、...
我不是被运营商收买了,我就是运... 最近网络之争,引来很多水军的攻击,其中我就看到一种说法,项立刚是被三大电信运营商收买了,为电信运营商...
梁定邦:人工智能年增速约30%... 来源:金融一线 12月28日金融一线消息,中国财富管理50人论坛2025年会在京召开,本届年会的主题...
红桥区6个行业高质量数据集全部... 近日,天津市2025年行业高质量数据集名单发布,红桥区数据局组织推荐的6个数据集均成功入选,覆盖工业...
我国交付国际热核聚变实验堆IT... 新华社合肥12月28日电(记者戴威、何曦悦)28日,由中国科学院合肥物质科学研究院等离子体物理研究所...
互联网运营优化三大模式:百度、... 互联网运营, 百度是基于权重和成本模型, 抖音头条则单内容作战×千人千面的神经模型, ...
郑州师范学院第二附属小学第二届... 大象新闻记者 李书恒 通讯员 李琪/文图 冬日暖阳映校园,科技之光耀童心。12月26日,郑州师范学院...
泽恩五金取得空芯插针端子专利,... 国家知识产权局信息显示,东莞市泽恩五金制品有限公司取得一项名为“一种空芯插针端子”的专利,授权公告号...
人形机器人产业,大利好! 12月26日,工业和信息化部人形机器人与具身智能标准化技术委员会(以下简称“标委会”)成立大会在京举...
筑牢伦理根基 让人工智能翻译传... (来源:中国改革报) 转自:中国改革报 □ 易曼 每一门语言都是人们在特定地域、经过漫长的历史和生活...
美林美育大课堂走进社区 | 萌... 当传统生肖文化邂逅指尖创意,当专业艺术资源走入寻常邻里,会碰撞出怎样的温暖火花?近日,北京韩美林艺术...