本笔记本将逐步指导您如何使用Qdrant作为OpenAI嵌入的向量数据库。Qdrant是一个用Rust编写的高性能向量搜索数据库,提供RESTful和gRPC API来管理您的嵌入向量。官方Python客户端qdrant-client可简化与应用程序的集成。
本笔记本展示了一个端到端流程,包括:
- 使用由OpenAI API生成的预计算嵌入。
- 将嵌入存储在Qdrant的本地实例中。
- 使用OpenAI API将原始文本查询转换为嵌入向量。
- 使用Qdrant在创建的集合中执行最近邻搜索。
什么是Qdrant
Qdrant 是一个开源向量数据库,它允许存储神经嵌入以及元数据(也称为payload)。Payload不仅可用于保存特定点的附加属性,还可用于过滤。Qdrant 提供了一种独特的过滤机制,该机制内置于向量搜索阶段,使其非常高效。
部署选项
Qdrant 可以通过多种方式启动,具体取决于应用程序的预期负载情况:
- 本地或内部部署,使用Docker容器
- 在Kubernetes集群上,使用Helm chart
- 使用 Qdrant Cloud
集成
Qdrant 提供 RESTful 和 gRPC 两种 API,无论您使用哪种编程语言都能轻松集成。不过,针对最流行的语言我们提供了一些官方客户端,如果您使用 Python,那么 Python Qdrant 客户端库可能是最佳选择。