谷歌推全新 Gemini API URL Context 功能 可详解网页内容

近日,正式推出其全新的 GeminiAPIURLContext 功能,旨在让 在浏览网页时有如人类一般的理解能力。这一功能于 5 月 28 日在 GoogleAIStudio 上线,标志着谷歌在 领域的又一次重大突破。

与我们常用的链接分享不同,URLContext 功能的运作方式截然不同。通常情况下,当我们将链接丢给 AI 时,它往往只是通过简单的浏览器工具或搜索引擎插件来读取网页内容,而这种方式常常只能获取到网页的摘要或部分信息。然而, 的 URLContext 则是专为开发者设计的 API,可以精准解析和理解网页中的所有内容,甚至可以处理 PDF、图片等多种格式的信息。

具体来说,URLContext 功能能够处理高达 34MB 的网页内容,支持多种文件格式,包括 HTML、JSON 和 CSV 等。谷歌产品负责人 LoganKilpatrick 表示,这项功能极大地简化了开发者的工作流程,使其能够在几行代码中实现深度的信息提取与处理。与传统的 「检索-增强生成」(RAG) 流程相比,URLContext 减少了繁琐的步骤,不再需要额外的内容提取、向量存储和检索机制。

这一功能的能力相当强大。通过一个简单的 URL,Gemini 可以提取特斯拉财报中的关键数据,如 「总资产」 和 「总负债」,而这些信息往往无法通过传统方式获取。此外,它还能够识别 PDF 中的复杂结构,包括表格和脚注等。这使得开发者能够更快速、准确地获得所需信息,极大提高了工作效率。

不过,URLContext 也有其局限性。它无法突破付费墙,对于需要登录才能访问的内容无能为力。此外,它对专用工具 (如 YouTube 视频和 GoogleDocs 等) 也不会进行处理。内容的处理费用是按照 Token 数量计费,因此开发者需要合理设计信息源,以控制成本。

URLContext 功能不仅展示了 AI 技术的前沿发展趋势,也让我们对未来的信息检索方式有了新的认识。

文章地址:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

苏宁打响国产 AI 反击战:灵思大模型携手寒武纪算力平台,推理效率暴涨 30% 训练成本狂降 70%

2025-9-3 1:22:15

AI 资讯

即梦 AI 系列模型开放 API,为开发者提供一站式图像与视频生成服务

2025-9-3 1:22:32

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索