近日,谷歌发布了一份名为《2025年Agents与基础应用白皮书》的行业研究报告。这份报告深入探讨了生成式人工智能代理的概念、架构和应用,详细阐述了代理如何通过工具访问实时信息、建议现实世界的行动,并规划和自主执行复杂任务,从而扩展了语言模型的能力。报告中提到的核心组件包括模型、工具和编排层,它们共同构成了代理的认知架构,使其能够有效地与环境交互并完成任务。这里面有很多有价值的内容,对于理解人工智能代理的未来发展和应用具有重要意义。
在人工智能领域,代理技术正逐渐成为推动行业发展的新引擎。这份名为“谷歌2025年Agents与基础应用白皮书”的报告,深入探讨了生成式人工智能代理的潜力、架构和应用前景,为我们揭示了代理技术如何扩展语言模型的能力,以及它们在现实世界中的应用潜力。
代理技术的核心在于其能够通过工具访问实时信息,并提出现实世界的行动建议。这意味着,代理不仅仅是被动响应用户指令的工具,而是能够主动推理、规划并执行任务的智能体。报告中提到,代理可以通过一个或多个语言模型来决定何时以及如何使用外部工具完成复杂任务,这些任务对于模型自行完成可能是困难或不可能的。
报告强调了代理内部运作的基础组件——认知架构的重要性。认知架构包括模型、工具和编排层,它们共同构成了代理的大脑和神经系统。模型是代理的中央决策者,负责遵循基于指令的推理和逻辑框架。工具则弥补了模型与外部世界交互的空白,使代理能够执行更广泛的行动。而编排层则描述了代理如何接收信息、进行内部推理,并指导其下一步行动或决策的循环过程。
在工具方面,报告详细介绍了扩展、函数和数据存储三种类型。扩展允许代理无缝执行API调用,而函数则允许模型输出函数及其参数,但不进行实时API调用。数据存储则提供了对更加动态和最新信息的访问,确保模型的响应始终基于事实和相关性。这些工具的使用,使得代理能够连接到外部API,执行API调用并检索实时信息,从而实现数据驱动的应用程序。
报告中还提到了提升模型性能的几种方法,包括上下文学习、基于检索的上下文学习和基于微调的学习。这些方法可以帮助模型获得特定知识,提高其在生产规模中使用工具的能力。例如,上下文学习可以在推断时为通用模型提供提示、工具和少量示例,使其能够‘即兴学习’如何以及何时使用这些工具来完成特定任务。
通过LangChain和LangGraph库,报告展示了如何快速构建原型代理。这些开源库允许用户通过“链式”连接一系列逻辑、推理和工具调用来回答用户的查询。例如,使用SerpAPI和Google Places API这些工具,代理可以回答用户的多阶段查询,如查询德州长角队上周的足球比赛对手及其体育馆地址。
报告展望了代理技术的未来,认为随着工具变得更加复杂和推理能力的增强,代理将有能力解决日益复杂的问题。此外,通过结合专业代理,我们可以创建一种‘混合代理专家’方法,能够在各种产业和问题领域提供出色的结果。
这篇文章的灵感来自于“谷歌2025年Agents与基础应用白皮书”。除了这份报告,还有一些同类型的报告也非常有价值,推荐阅读,这些报告我们都收录在同名星球,可以自行获取。
以上为节选样张,关注公众号【蝉鸣报告】回复领取PDF完整电子版(无广告)。
【蝉鸣报告】每日更新最新硬核报告,覆盖产业报告、全球化、经济报告、趋势等全领域。