2020 年,帕特里克·刘易斯 (Patrick Lewis) 在一篇开创性的论文中首次提出了“检索增强生成 (Retrieval-Augmented Generation, RAG)”的概念,将其视为提升生成式 AI 模型准确性和可靠性的关键途径。这一术语很快获得了业界的认可,尽管近期刘易斯对其略显粗犷的缩写表达了歉意。
随着 AI 技术的演进,越来越多的 AI 代理集成了多样的生成模型,因此理解 RAG 等概念变得至关重要。对于 AI 爱好者而言,掌握 RAG 的原理不仅有助于推动个人项目的发展,也为在 Theoriq 协议上构建动态 AI 代理及其集群提供了理论依据。
RAG 是什么?
检索增强生成,简称 RAG,是一种增强 AI 提供准确、最新回应的能力的技术。设想一下,当你询问 AI 一个问题时,它能够迅速从互联网或大型数据库中检索出最新信息,这便是 RAG 的核心作用。借助 RAG,大型语言模型(Large Language Model, LLM)可以利用最新的事实数据来回答问题,而不仅仅是依赖其预训练时的数据。
预训练数据的意义
要深入了解 RAG,首先需要明确预训练数据和 LLM 的工作原理。LLM 是通过对大量的文本数据进行训练来学习语言规则和执行基本语言任务的,从而具备一定的理解和生成人类语言文本的能力。不过,传统的预训练模型存在以下几个限制:
静态信息:由于信息是在模型训练完成时固定下来的,因此随着时间推移,模型的知识库不会更新。
偏见和不准确性:模型可能会再现训练数据中的偏差或错误,这些偏差或错误并不总是反映现实情况。
缺乏实时信息:LLM 无法获取最新的事件或数据更新。
这也是为何现有的 AI 聊天机器人(如 ChatGPT)不能作为搜索引擎使用的原因。尽管它们能生成富有创意的回答,但在处理实时信息和真实场景时仍显不足。
RAG 如何提升 AI 代理的表现
假设你向一个 AI 代理询问:“今天我应该穿什么?” 如果没有 RAG 的支持,它可能会给出一个笼统的答案,例如“穿些舒适的衣服吧,比如牛仔裤和 T 恤”。然而,借助 RAG 的力量,相同的 AI 可以扮演“造型师”的角色,查询最新的天气预报,考虑你的穿着场合,并分析时尚潮流——进而给出更适合你需求的着装建议。
在 Theoriq 中,我们定义 AI 代理为一种自主软件系统,它利用现代生成式 AI 模型进行规划、访问数据、使用工具、作出决策,并与现实世界互动以执行特定功能。— Theoriq 团队,2024 年。
RAG 的工作流程
典型的 RAG 流程涉及将文档分解成更小的片段,计算每个片段的嵌入,并将它们存储在向量数据库中。当接收到问题时,系统会根据相似度度量来检索最相关的文档片段,这有助于 LLM 生成更加准确和贴切的回答。此过程中还可能包含重新排序或过滤检索信息等中间步骤。
通过这种方式,RAG 不仅增强了 AI 的反应速度和准确性,还显著提高了用户体验。随着 RAG 技术的应用日益广泛,它将继续推动 AI 发展的新边界。
声明:本网站所有相关资料如有侵权请联系站长删除,资料仅供用户学习及研究之用,不构成任何投资建议!