Google 今日正式推出 GeminiAPI 中的 「文件搜索工具」(FileSearchTool),一款完全托管的 RAG 系统。该工具将私有文件无缝转化为 Gemini 的知识库,用户无需自行处理数据分块、嵌入生成或向量存储等繁琐步骤,直接通过 API 集成即可实现高效检索与生成。
工具核心功能: 一站式 RAG 流程打包文件
搜索工具的核心在于其端到端的集成设计。它自动处理文件上传、索引和检索过程,利用 Google 的 GeminiEmbedding 模型 (gemini-embedding-001) 生成高质量向量表示,支持语义搜索而非简单关键词匹配。这意味着开发者可以专注于应用逻辑,而非底层基础设施维护。
据 Google 官方博客介绍,该工具支持多种常见文件格式,包括 PDF、DOCX、TXT、JSON,以及各种编程语言文件 (如 Python、Java 等源代码)。用户只需通过 GeminiAPI 的 generateContent 接口调用,即可将私有文档导入知识库。系统会智能分块数据,确保检索结果的上下文连贯性,并在响应中自动生成引用链接,直接指向文档的具体部分,从而提升输出的透明度和可验证性。
这一设计特别适用于企业级场景,例如内部知识助手、智能支持机器人或内容发现平台。Google 强调,对于海量数据、频繁更新、重复查询或需要严格可追溯性的应用,该工具能显著降低开发门槛,并提供可扩展的性能支持。
创新计费模式: 查询免费,首次索引低至 0.15 美元/百万词元
与传统 RAG 解决方案不同,文件搜索工具采用全新的计费范式: 查询期间的存储和嵌入生成完全免费,仅在首次索引文件时收取嵌入生成费用。该费用基于词元 (token) 计算,使用 gemini-embedding-001 模型的标准率为每百万词元 0.15 美元。这使得工具在成本控制上更具竞争力,尤其适合大规模部署和实验性项目。Google 产品经理在公告中指出:「这一计费模式大幅降低了 RAG 实现的入门门槛和运营成本,帮助开发者更快地将 AI 落地。」 后续文件更新或增量索引将仅按实际变化部分计费,进一步优化了资源利用效率。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。