概要
负责企业知识问答系统核心研发,完成多源文档接入、三路混合检索、LangGraph 可恢复运行时与知识治理工作台建设。
业务价值
将企业分散资料沉淀为可持续同步、可追溯引用的知识问答能力,降低检索和答复成本。
工程深度
覆盖三路混合检索、LangGraph 编排、知识治理、连接器边界控制与评测回归体系。
证据来源
GitHub 仓库 README / docs/reference / tests
仓库 · 置信度 高 · 验证时间 2026-03-13
- 证据级别:严格复核(核心区仅展示可复核指标)
- 来源类型:仓库/代码记录
- 来源链接:已提供公开链接,可独立复核
- 验证时间:2026-03-13(距今 18 天,时效性高)
判定原因:判定为高置信度:按严格口径整理,可回溯到仓库或代码记录,包含可访问来源链接,验证时间距今 18 天。
查看证据背景
企业资料分散在本地目录、Notion 等多源,业务希望把制度、FAQ、项目文档沉淀为可检索、可引用、可持续同步的知识库问答系统。
挑战
传统单路检索难以同时覆盖标题、关键词与语义混合场景,问答链路缺少可解释恢复机制,文档接入与 chunk 质量治理也缺乏统一工作台。
行动与成果
解决方案
- 搭建混合检索:结构、全文、向量三路召回配合 query rewrite、加权 RRF 与 rerank,提升复杂问题场景下的证据命中率。
- 重构可恢复运行时:在 Gateway 与检索层引入 LangGraph,支持 checkpoint、interrupt/resume、
step_events 与人工澄清。 - 补齐知识治理:建设多知识库、多源连接器、chunk 治理、retrieve/debug、审计与回归门禁能力。
成果
形成面向中文企业场景的 RAG 问答系统,支持 grounded answer、引用溯源、多源同步、检索调试与可恢复执行,并具备持续回归验证能力。
关键指标
设计结构检索、全文检索、向量检索三路召回链路,结合加权 RRF 融合与 rerank,支持 `citations`、`grounding_score` 与 `trace_id` 返回。 将 Gateway 问答链路与 KB 检索链路改造为 LangGraph 运行时,支持 checkpoint、interrupt/resume、人工澄清与 `step_events`。 建设 ingest 与知识治理工作台,支持多知识库、多源连接器、chunk 拆分/合并/禁用及 retrieve/debug 调试能力。 建立 smoke-eval 与 regression gate 回归门禁,将检索质量、可恢复执行与发布验证纳入同一交付流程。 技术栈
FastAPILangGraphVue 3PostgreSQLQdrantRAGFastEmbedDockerLangChain