我们团队维护的一个基于 RAG 的内部知识库系统遇到了一个棘手的瓶颈:数据新鲜度。最初的架构简单粗暴,每晚通过 Spark 作业全量读取源数据,计算 embedding,然后将数百万文档向量完全重建到 OpenSearch 索引中。这个过程
2023-11-21