/s/1JtgI9ufKdGyVV1LYD0pZGg 提取码: 4yfp
一、7 种 RAG 模式 Naive RAG 是最基础的架构,包含简单的文档检索、处理和生成响应的流程
Retrieve-and-rerank 在基础 RAG 上增加了重排序步骤,可以优化检索结果的相关性
Multimodal RAG 能够处理图像等多种类型的数据,不仅限于文本
Graph RAG 利用图数据库增强知识连接,可以更好地理解文档间的关系
Hybrid RAG 结合了多种技术的优势,包含图结构和传统检索方法
Agentic RAG Router 使用 AI Agent 来路由和处理查询,可以选择最适合的处理路径
Agentic RAG Multi-Agent 使用多个专门的 AI Agent 协同工作,可以调用不同的工具(如向量搜索、网页搜索、Slack、Gmail 等)
二、认识 RAG RAG 的核心思想是将信息检索与生成模型相结合。在传统的 LLM 应用中,模型仅依赖训练时学到的知识来回答问题,这导致了知识更新困难、回答可能过时或不准确等问题。而 RAG 系统通过在生成回答前主动检索相关信息,将实时、准确的知识作为上下文提供给模型,从而显著提升了回答的质量和可靠性。
RAG 技术最显著的优势在于其知识的时效性和可追溯性。通过持续更新知识库,系统可以始终掌握最新信息,而无需重新训练模型。同时,每个回答都能追溯到具体的信息来源,这极大地提升了系统的可信度和实用性。此外,RAG 还大幅降低了传统 LLM 容易产生"幻觉"的问题,因为所有的回答都建立在检索到的真实信息基础之上。
三、RAG怎么解决AI幻觉问题? AI幻觉是指AI生成的内容与事实不符或缺乏依据。RAG通过以下方式减少幻觉:
检索知识库:当用户问问题时,RAG会先去知识库中查找与问题最相关的资料(比如文档、数据等)。这些资料是经过验证的,所以AI生成的内容会更有依据。 减少模型更新和推理成本:AI模型不需要频繁更新来学习新知识,因为知识库可以随时更新,AI只需要检索最新的知识即可。
四、如何构建RAG知识库? 构建RAG知识库的过程大概如下:
准备知识库数据:把相关的文档、资料整理好,这些可以是公司内部的文件、行业知识等。 文本分块:把长文档分割成小块,每块包含一部分信息。比如一篇长文章可以分成多个段落。 向量化:用一个叫 “embedding model” 的工具,把文本块转换成向量,存储到向量数据库中。后面使用如(余弦相似法,求问题和对应知识库内容距离,得到相似度) 设置检索规则:告诉RAG如何根据用户问题检索最相关的向量
五、RAG 的应用场景 RAG 技术的出现,使得许多传统的 NLP 任务得到了全新的解决方案。以下是几个 RAG 技术的典型应用场景:
1、智能问答:在客服、教育、医疗、企业内部知识库等领域,RAG 技术可以用于构建更为智能的问答系统。这类系统不仅可以回答常规问题,还能根据用户的特定问题实时检索相关信息,提供更加精准的答案。
2、内容生成:RAG 技术还可以用于内容创作领域,如新闻生成、技术文档编写等。通过结合检索到的最新信息,RAG 生成的内容不仅保持了连贯性,还能反映出当前的最新趋势和知识,甚至跟自己历史创作内容相结合,生成的内容可以更具有个人风格。
3、辅助决策:对于需要处理大量文档和信息的行业,如法律、金融等,RAG 技术可以帮助用户快速找到相关案例、法规或市场数据,辅助决策和研究工作。
六、RAG 的技术优势 RAG 作为一种创新的技术方法,具有以下几大优势:
1、知识覆盖面广,更专业 :通过引入检索机制,RAG 可以访问私有领域知识库,这使得它在处理涉及专业领域问题时,依然能够生成准确的答案。
2、生成内容的准确性和上下文相关性增强:相比于传统的生成模型,RAG 生成的内容更加可靠,因为它可以借助检索到的相关信息,确保生成的文本与问题或上下文高度相关。
3、灵活性和扩展性强:RAG 模型可以灵活地应用于不同的领域和任务中,只需更换或扩展其检索库,便能适应新的应用场景。在企业内部,文档针对不同的智能部门有权限之分,RAG 的灵活性就可以很轻松满足这类需求。
七、技术挑战与突破方向 虽然RAG展现强大潜力,但工程实践中仍存在关键瓶颈:
1.检索质量瓶颈 A、长尾查询的语义匹配准确率不足 B、混合检索策略(关键词+向量)成为新趋势
2.上下文长度限制 A、当前模型输入长度普遍在4k-32k tokens B、基于滑动窗口的层次化检索方案正在突破
3.多模态扩展 A、跨模态检索(如图文混合问答)成为研究热点 B、CLIP等视觉语言模型赋能多模态RAG
4.推理效率优化 A、基于蒸馏技术的轻量化检索器开发 B、实时增量索引更新技术突破
八、RAG技术原理与流程 初级 RAG 在检索质量、响应生成质量以及增强过程中存在多个挑战,高级 RAG 范式随后被提出,高级RAG在数据索引、检索前和检索后都进行了额外处理。通过更精细的数据清洗、设计文档结构和添加元数据等方法提升文本的一致性、准确性和检索效率。
随着 RAG 技术的进一步发展和演变,新的技术突破了传统的 初级 RAG 检索 — 生成框架,基于此我们提出模块化 RAG 的概念。在结构上它更加自由的和灵活,引入了更多的具体功能模块,例如查询搜索引擎、融合多个回答。技术上将检索与微调、强化学习等技术融合。流程上也对 RAG 模块之间进行设计和编排,出现了多种的 RAG 模式。
原始 RAG 的流程包括传统的索引、检索和生成步骤。核心是信息检索和大型语言模型调用两个关键过程。信息检索通过连接外部知识库,获取与问题相关的信息;而大语言模型调用则用于将这些信息整合到自然语言生成的过程中,以生成最终的回答
有疑问加站长微信联系(非本文作者)
