为什么传统 RAG 无法满足企业工作流程的要求
检索增强生成是将 LLM 输出扎根于事实内容的突破,但检索相关块然后生成答案的标准模式在企业环境中达到了上限。真正的企业问题很少能通过单个文档段落得到解答。询问如何请求延长休假的员工需要人力资源政策文档中的信息、有关其特定休假类型的上下文、其部门的审批工作流程以及 HRIS 系统中现有请求的当前状态。标准 RAG 检索一些块并希望模型能够合成答案。实际上,这会产生部分正确但错过关键程序步骤的响应,或者更糟糕的是,由于检索步骤出现了被取代的文档版本,因此自信地陈述过时的策略。
Agentic RAG:在单一管道中检索、推理和操作
Agentic RAG 扩展了检索范式,使代理能够迭代检索、推理其当前知识中的差距、从不同来源再次检索并最终代表用户采取行动。代理执行推理循环,而不是单个检索步骤。首次检索:拉取休假政策。推理步骤:策略针对不同的休假类型引用了不同的规则,但用户尚未指定其休假类型。决策:检查 HRIS 系统中用户的有效休假记录。第二次检索:从 Workday 中提取员工的休假详细信息。推理步骤:员工正在休 FMLA 休假,该休假有特定的延期流程。第三次检索:拉取FMLA延期程序。操作:生成预先填写员工详细信息的延期申请表,并通过正确的审批工作流程提交。这种多跳模式将问答系统转变为工作流执行引擎。用户提出一个问题并收到一个已完成的操作,而不仅仅是他们需要自己采取行动的答案。
现实世界模式:多跳检索和工具增强生成
我们跨多个重复的企业模式部署代理 RAG。第一个是从政策到行动:代理检索相关政策文档,将其与人力资源和 IT 系统中员工的特定环境进行交叉引用,并执行适当的工作流程。第二个是诊断解决方案:对于 IT 支持场景,代理检索故障排除指南、查询监控系统的当前状态、通过批准的工具集成运行诊断命令并应用修复。第三是知识合成:对于跨越多个知识领域的复杂问题,代理在不同的文档集合中执行并行检索,通过检查文档新鲜度和权威性来协调冲突信息,并生成带有引用的综合响应。在每种模式中,关键要素是位于检索步骤之间的推理循环。代理不仅仅检索和生成。它检索、评估是否有足够的上下文、识别差距并有策略地检索更多信息,直到获得自信地采取行动所需的全面信息。
ActiveMotion Team
相关文章
评论
暂无评论。成为第一个评论的人!