Milvus Semantic Cache
本指南涵盖在 Kubernetes 中部署 Milvus 作为 Semantic Router 的 Semantic Cache 后端。与默认的 memory cache 相比,Milvus 提供了持久化、可扩展的向量存储。
备注
Milvus 是可选的。Router 开箱即用,默认使用 memory backend。当您需要持久化、水平扩展或在 Router 副本之间共享缓存时,请使用 Milvus。
部署选项
有两种方法可用:
- Helm: 快速启动和参数化部署
- Milvus Operator: 生产级生命周期管理、滚动升级、健康检查和依赖编排