Anthropic 的 Claude AI 正在 Twitch 上玩宝可梦——进展缓慢
创始人
2025-02-27 00:14:49
0

周二下午,Anthropic 在 Twitch 上启动了"Claude 玩宝可梦"直播,展示其最新的 AI 模型 Claude 3.7 Sonnet 游玩《宝可梦红版》的过程。这成为了一个引人入胜的实验,展现了当今 AI 技术的能力以及人们对此的反应。

AI 研究人员曾使用各种视频游戏来测试新模型,从《街头霸王》到《你画我猜》,但这往往更多是为了娱乐而非实用。不过,Anthropic 表示,宝可梦proved成为了 Claude 3.7 Sonnet 的有效测试基准,这个模型能够有效地"思考"游戏中的各种谜题。

与 OpenAI 的 o3-mini 和 DeepSeek 的 R1 类似,Claude 3.7 Sonnet 能够通过"推理"解决复杂挑战,比如玩一款专为儿童设计的电子游戏。虽然其前身 Claude 3.5 Sonnet 在游戏开始时就失败了——无法走出真新镇的玩家家门,但 Claude 3.7 Sonnet 已经成功获得了三个道馆徽章。

然而,新版 Claude 仍然会遇到困难。在 Twitch 直播数小时后,模型被一堵岩石墙挡住了去路,无论如何都无法穿过。一位 Twitch 用户这样总结道:"谁会赢,是投入了数千小时编程的 AI,还是一堵石墙?"最终,Claude 意识到可以绕过这堵墙。

虽然看着 Claude 像呆呆兽一样缓慢地探索《宝可梦红版》,每一步都要深思熟虑,确实令人有些着急。但这个过程又十分引人入胜。直播画面左侧显示着 Claude 的"思考过程",右侧则是实时游戏画面。

在某个时刻,Claude 试图在大木博士的实验室里找到他,但因为场景中有其他 NPC 而感到困惑。"我注意到在我下方出现了一个新角色——一个黑发穿白大褂的角色,位于坐标 (2, 10),"Claude 写道,"这可能是大木博士!让我下去和他谈谈。"随后,Claude 错误地与一个之前已经交谈过多次的 NPC 对话,而不是博士。Twitch 聊天室里的上千名观众中,有些人开始变得焦躁。但那些观看时间较长的观众则显得不那么担心。

"大家冷静,"一位观众在聊天室写道,"在此之前我们已经进出大木博士的实验室十次才弄明白该怎么继续。"

对资深 Twitch 用户来说,Anthropic 的这次直播格式可能会唤起怀念。十多年前,数百万人曾在一个名为"Twitch 玩宝可梦"的首创性在线社交实验中共同游玩《宝可梦红版》。每个用户都可以通过 Twitch 聊天来控制角色,这自然导致了混乱的游戏过程。

一些 AI 研究人员表示"Twitch 玩宝可梦"启发了他们的工作。2023 年 10 月,西雅图软件工程师 Peter Whidden 发布了一段 YouTube 视频,详细介绍他如何训练强化学习算法来玩宝可梦。他的 AI 花了超过 50,000 小时才学会如何成功游玩,其中一个挑战是 AI 更喜欢欣赏像素化的游戏场景,而不是实际玩游戏。

像 Whidden 和 Anthropic 这样的 AI 驱动的"Twitch 玩宝可梦"重现虽然很有趣,但也让人感到些许惆怅。原版直播之所以成为 Twitch 历史上的重要时刻,是因为它以一种意想不到的方式将人们联系在一起。大家都是同一个团队,共同努力让游戏角色停止原地打转,真正推进游戏进程。

到了 2025 年,我们似乎不再是队友,而是成了旁观者,看着 AI 模型试图玩一个我们很多人在五岁时就已经掌握的游戏。这是一个由 AI 引发的缩影,反映了一个更大的趋势:我们的在线体验正从共享的群体活动转变为更加孤独的个人行为。

相关内容

热门资讯

瑞凌股份接待1家机构调研,包括... 2025年12月17日,瑞凌股份披露接待调研公告,公司于12月17日接待银河证券1家机构调研。 公告...
荣耀WIN系列定档,新品下周见 今天,荣耀手机正式宣布,全新荣耀WIN系列将于12月26日14:30发布。 官方介绍显示,“官宣!荣...
【中证快报】12月16日中证投... 【中证头条】 火箭回收捕获臂全尺寸原型机交付 --------- 据报道,国内采用“不锈钢火箭+捕获...
我都化成灰33亿年了 咋还能被... 人类一直在以各种方法探寻生命起源之谜。近日,科学家通过人工智能技术,在南非距今33.3亿年前的岩石中...
日本火箭发射任务因设备异常紧急... 来源:市场资讯 (来源:新华社) 新华社东京12月17日电(记者钱铮)日本宇宙航空研究开发机构(JA...
打破学科界限,AI为音乐疗愈“... ◎本报记者 李 均 近日,在西藏自治区萨迦县麻布加乡中心小学六年级二班教室内,上海音乐学院人工智能音...
专家热议AI与劳动:赋能劳动者... 近日,在第59期“安泰·问政:人工智能时代的劳动与劳动者”论坛上,来自学界、企业界等嘉宾深入探讨人工...
“蚂蚁阿福”超半数用户 来自三... [ 目前全国已有500多位名医也在“蚂蚁阿福”上开设了“AI分身”。数据显示,这些“AI医生”已累计...
从“+AI”到“AI+” 智能... (记者 林碧涓)当生成式AI从实验室走向产业前沿,一场围绕AI“入口”的争夺战已然打响。从AI手机、...
华为云城市峰会2025·乌兰察... 12月16日,华为云城市峰会2025·乌兰察布召开。记者 王俊平 摄 12月16日,华为云城市峰会2...
原创 印... 近日,印度高调宣布了一件事:“2028年,印度航天局将发射“月船4号”去月球,挖2到3公斤土并带回地...
日本版GPS系统卫星发射紧急停... 新华社东京12月17日电(记者钱铮)日本宇宙航空研究开发机构(JAXA)17日原定发射一枚搭载日本版...
斩断网络伪科普幕后的“流量黑手... “吃木薯可以助眠”“冷冻馒头会长黄曲霉素”“量子育种能增产增收”……一段时间以来,网络平台上不时出现...
性能旗舰赛道再添猛将!荣耀WI... 【ZOL中关村在线原创新闻】当下手机市场,性能旗舰已成各大品牌必争之地,尤其是聚焦游戏体验的电竞赛道...
微博公布2025十大数码热词:... 12月17日消息,年末将至,今日微博公布了2025十大数码热词:手机国补、Air、eSIM、兼容苹果...
影石“连麦”腾讯背后:AI硬件... 来源:新京报 当下,一场看似无序的AI硬件跨界潮正在上演:阿里做AI眼镜,影石做无人机,大疆做扫地机...
深圳前海发布四大领域场景 科技日报讯(记者罗云鹏)记者12月15日获悉,在日前举办的2025前海·宝安“宝景创享”场景对接大会...
迈向自动驾驶:地平线技术生态大... 时代奔涌,风聚成潮。中国智能驾驶产业在经历了技术验证与场景探索后,正步入以“规模化商用”为核心命题的...
丝芭传媒回应鞠婧祎待遇和收入:... 12月16日,上海丝芭文化传媒集团有限公司官方微博@丝芭传媒发布“关于我司艺人鞠婧祎的事实阐述和声明...
原创 将... 前段时间,我们有个朋友在直播电商这个领域做了5年。他最近突然跟我们说,想转向做内容创作和电商的结合,...