研究发现:AI搜索引擎更倾向于引用冷门网站信息
创始人
2025-10-29 15:20:45
0

10 月 28 日消息,自去年谷歌推出饱受诟病的“AI 概览”(AI Overviews)功能以来,公众已普遍意识到:由人工智能驱动的搜索结果,与搜索引擎数十年来提供的传统链接列表存在巨大差异。如今,一项新的研究量化了这种差异,揭示出 AI 搜索引擎倾向于引用那些访问量较低、甚至在传统谷歌搜索的前 100 名结果中都难以出现的网站。

IT之家注意到,在题为《生成式人工智能时代的网络搜索特征分析》("Characterizing Web Search in The Age of Generative AI")的预印本论文中,德国波鸿鲁尔大学(Ruhr University in Bochum)与马克斯・普朗克软件系统研究所(Max Planck Institute for Software Systems)的研究人员将谷歌传统搜索结果与其 AI 概览(AI Overviews)、Gemini 2.5-Flash 进行对比,并纳入了 GPT-4o 的网页搜索模式以及“GPT-4o 搭配搜索工具”(即仅在大语言模型判断需要外部信息时才调用网络搜索)的表现。

研究人员从多个来源选取测试查询语句,包括“WildChat”数据集中用户向 ChatGPT 提出的具体问题、AllSides 平台上列出的政治议题,以及亚马逊上被搜索次数最多的 100 种商品。

研究发现,生成式 AI 搜索工具所引用的信息来源,其所在网站的受欢迎程度往往低于传统搜索前 10 名的网站,这是根据域名追踪工具 Tranco 的测量结果得出的。相较于传统谷歌搜索结果中的链接,AI 引擎引用的网站更有可能不在 Tranco 统计的全球前 1,000 名或前 1,000,000 名域名之内。其中,Gemini 搜索尤为明显:其引用来源的中位数排名落在 Tranco 前 1,000 名之外,表明其高度依赖不常见的网站资源。

此外,AI 搜索引擎引用的内容往往在相同关键词的传统谷歌搜索结果中几乎不会出现在靠前位置。例如,在谷歌 AI 概览引用的来源中,有 53% 并未出现在对应查询的传统谷歌搜索前十名结果中;更有 40% 的来源甚至未进入前 100 名。

当然,这些差异并不意味着 AI 生成的结果就一定“更差”。研究发现,基于 GPT 的搜索更倾向于引用企业官网和百科类网站作为信息源,而几乎从不引用社交媒体内容。

一项基于大语言模型的分析工具显示,AI 搜索结果所涵盖的可识别“概念”数量,与传统搜索前十条结果相当,说明两者在信息细节、多样性与新颖性方面水平相近。但与此同时,研究人员也指出:“生成式引擎往往会对信息进行压缩,有时会省略次要或模糊的内容,而这些内容在传统搜索结果中仍得以保留。”这一点在面对含义模糊的搜索词(如多名公众人物共用的名字)时尤为突出,此时“传统搜索结果的信息覆盖更为全面”。

另一方面,AI 搜索引擎也有其优势 —— 它们能够将预训练获得的“内部知识”与引用网页中的信息相结合。这一点在“GPT-4o 搭配搜索工具”中表现得尤为明显:该模式常常不提供任何外部引用链接,而是直接基于自身训练数据给出答案。

然而,这种对预训练数据的依赖在查询时效性强的信息时也可能成为短板。当研究人员使用谷歌 9 月 15 日“实时热搜榜”中的关键词进行测试时,发现“GPT-4o 搭配搜索工具”经常回应诸如“您能否提供更多详细信息?”之类的提示,而非主动搜索最新的网络资讯。

尽管研究人员并未最终判定 AI 搜索引擎整体上优于或劣于传统搜索链接,但他们呼吁未来应加强对生成式搜索系统的评估方法研究,强调需综合考虑信息来源的多样性、概念覆盖的完整性,以及信息整合能力等维度,以建立更科学的评价体系。

【来源:IT之家】

相关内容

热门资讯

AI人才争夺战白热化,谷歌另辟... IT之家 12 月 20 日消息,在 OpenAI、Meta 和 Anthropic 之间的人才竞争...
SpaceX罕见披露卫星失联事... 据媒体19日报道,数小时前,近期备受资本市场关注的SpaceX罕见披露了一起在轨卫星事故。 据“星链...
【年度AI观察】2025,人形... 文 | 智能相对论 作者 | 许成行 2025年,人形机器人产业在争议中迎来发展深水区。 一边是20...
爆屏修复机构排名揭秘:靠谱好用... 在当今数字化时代,手机已经成为人们生活中不可或缺的工具。然而,手机屏幕不慎摔碎、出现裂痕等爆屏情况时...
“风清”“风雷”“风顺”气象人... (来源:经济日报) 转自:经济日报 12月19日,中国气象局发布“风清”“风雷”“风顺”三个气象人...
“固态电池”上市容易,上车可就... 作者|Hayward 原创首发|蓝字计划 在“国产 GPU 第一股”“国产GPU 第二股”点燃投资市...
“千兆上网”仍卡顿,运营商回应... “光纤到户,千兆上网”近年在大城市逐渐普及,然而很多用户在打游戏或者视频直播时依然会遇到卡顿问题,这...
元戎启行获产业巨头追捧,剑指2... 来源:华旋评测 据媒体报道,元戎启行获得国内头部Tier 1和海外豪华车企的青睐,可能获得战略投资。...
ChatGPT新增暖心程度调节... IT之家 12 月 20 日消息,据科技媒体 The Verge 今天报道,OpenAI 昨天在 C...
广告电商MCN协同发展,哪家母... 概述 在母婴垂直领域,多个平台基于用户规模、服务范围与专业度等维度呈现不同特点。以下内容基于公开信息...
摩尔线程上市后的第一场大会,办... 国产GPU的叙事重心,正在从“造芯”转向“造生态”。 作者|王艺 摩尔线程上市后的首场大会来了。 2...
大庆油田数智技术减负提效 □伊丽娜 王凤颖 本报记者 刘楠 李民峰 中国石油大庆油田自主研发的抽油机井电参数字化技术,已累计应...
求囤货照片,美国知名空头质疑英... 美国知名空头迈克尔·伯里征求美国英伟达公司图形处理器(GPU)被客户囤积的证据,尤其是照片。 美国本...
苹果为何在日本大幅降低“苹果税... 为了遵守一部新生效的法律,日本的“苹果税”率从30%调降至21%,中小开发者从15%降至10% 文 ...
公牛集团回应宣传语争议:有第三... 来源:澎湃新闻 此前,广东中山市家的电器有限公司(以下简称“家的公司”)多个销售人员在社交平台发布视...
上海发布“游戏沪十条”,为游戏... 12月19日,2025年度中国游戏产业年会在上海徐汇西岸国际会展中心落幕。大会发布《2025年中国游...
从代码到衣橱:SHEIN 斩获... 如果你对 SHEIN 的印象还停留在“一家神秘的时尚独角兽”,那你可能已经错过了它的第二张面孔,也是...
GPT - 5.2发布后用户吐... OpenAI十周岁生日时发布了GPT - 5.2,该模型在基准测试等表现亮眼,但社交网络上用户却集体...
瑞声科技(02018)入选“恒... 智通财经获悉,12月18日,恒生指数公司宣布推出恒生港股通电子业主题指数。 该指数反映可经港股通买卖...
2025年消费信贷市场观察:如... 随着消费信贷监管持续趋严,如何在众多借贷产品中甄别合规、透明、低息的正规平台,成为消费者关注的焦点。...