Langchain

Langchain 是一个库,它使得开发基于大型语言模型的应用程序变得更加容易。它统一了不同库的接口,包括主要的嵌入提供者和 Qdrant。使用 Langchain,您可以专注于业务价值,而不是编写样板代码。

Langchain 将 Qdrant 集成作为合作伙伴包分发。

它可能通过 pip 安装:

pip install langchain-qdrant

该集成支持使用密集/稀疏和混合检索来搜索相关文档。

Qdrant 作为一个向量索引,可以存储用于生成它们的文档的嵌入。有多种使用方式,但调用 QdrantVectorStore.from_textsQdrantVectorStore.from_documents 可能是最直接的入门方式:

from langchain_qdrant import QdrantVectorStore
from langchain_openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()

doc_store = QdrantVectorStore.from_texts(
    texts, embeddings, url="<qdrant-url>", api_key="<qdrant-api-key>", collection_name="texts"
)

使用现有集合

要获取一个langchain_qdrant.QdrantVectorStore的实例而不加载任何新文档或文本,你可以使用QdrantVectorStore.from_existing_collection()方法。

doc_store = QdrantVectorStore.from_existing_collection(
    embeddings=embeddings,
    collection_name="my_documents",
    url="<qdrant-url>",
    api_key="<qdrant-api-key>",
)

本地模式

Python客户端允许您在本地模式下运行相同的代码,而无需运行Qdrant服务器。这对于测试和调试非常有用,或者如果您计划只存储少量向量。嵌入可以完全保存在内存中或持久化到磁盘上。

内存中

对于一些测试场景和快速实验,您可能更倾向于将所有数据仅保存在内存中,这样当客户端被销毁时数据就会丢失——通常是在脚本/笔记本结束时。

qdrant = QdrantVectorStore.from_documents(
    docs,
    embeddings,
    location=":memory:",  # Local mode with in-memory storage only
    collection_name="my_documents",
)

磁盘存储

本地模式,不使用Qdrant服务器,也可以将您的向量存储在磁盘上,以便在运行之间保持持久性。

qdrant = Qdrant.from_documents(
    docs,
    embeddings,
    path="/tmp/local_qdrant",
    collection_name="my_documents",
)

本地服务器部署

无论您选择使用Docker容器在本地启动QdrantVectorStore,还是选择使用官方Helm图表进行Kubernetes部署,连接到此类实例的方式都是相同的。您需要提供一个指向服务的URL。

url = "<---qdrant url here --->"
qdrant = QdrantVectorStore.from_documents(
    docs,
    embeddings,
    url,
    prefer_grpc=True,
    collection_name="my_documents",
)

QdrantVectorStore 支持3种相似性搜索模式。在设置类时,可以使用 retrieval_mode 参数进行配置。

  • 密集向量搜索(默认)
  • 稀疏向量搜索
  • 混合搜索

仅使用密集向量进行搜索,

  • retrieval_mode 参数应设置为 RetrievalMode.DENSE(默认)。
  • 应为embedding参数提供一个密集嵌入值。
from langchain_qdrant import RetrievalMode

qdrant = QdrantVectorStore.from_documents(
    docs,
    embedding=embeddings,
    location=":memory:",
    collection_name="my_documents",
    retrieval_mode=RetrievalMode.DENSE,
)

query = "What did the president say about Ketanji Brown Jackson"
found_docs = qdrant.similarity_search(query)

仅使用稀疏向量进行搜索,

  • retrieval_mode 参数应设置为 RetrievalMode.SPARSE
  • 必须提供一个实现SparseEmbeddings接口的稀疏嵌入提供者作为sparse_embedding参数的值。

langchain-qdrant 包提供了一个基于 快速嵌入 的开箱即用实现。

要使用它,请安装FastEmbed包

from langchain_qdrant import FastEmbedSparse, RetrievalMode

sparse_embeddings = FastEmbedSparse(model_name="Qdrant/BM25")

qdrant = QdrantVectorStore.from_documents(
    docs,
    sparse_embedding=sparse_embeddings,
    location=":memory:",
    collection_name="my_documents",
    retrieval_mode=RetrievalMode.SPARSE,
)

query = "What did the president say about Ketanji Brown Jackson"
found_docs = qdrant.similarity_search(query)

要使用密集和稀疏向量进行混合搜索并进行分数融合,

  • retrieval_mode 参数应设置为 RetrievalMode.HYBRID
  • 应为embedding参数提供一个密集嵌入值。
  • 必须提供一个实现SparseEmbeddings接口的稀疏嵌入提供者作为sparse_embedding参数的值。
from langchain_qdrant import FastEmbedSparse, RetrievalMode

sparse_embeddings = FastEmbedSparse(model_name="Qdrant/bm25")

qdrant = QdrantVectorStore.from_documents(
    docs,
    embedding=embeddings,
    sparse_embedding=sparse_embeddings,
    location=":memory:",
    collection_name="my_documents",
    retrieval_mode=RetrievalMode.HYBRID,
)

query = "What did the president say about Ketanji Brown Jackson"
found_docs = qdrant.similarity_search(query)

请注意,如果您已使用HYBRID模式添加了文档,您可以在搜索时切换到任何检索模式。因为集合中既有密集向量也有稀疏向量。

下一步

如果您想了解更多关于在基于Langchain的应用程序中运行Qdrant的信息,请阅读我们的文章 使用Langchain和Qdrant进行问答,无需样板代码。更多信息 也可以在Langchain文档中找到。

这个页面有用吗?

感谢您的反馈!🙏

我们很抱歉听到这个消息。😔 你可以在GitHub上编辑这个页面,或者创建一个GitHub问题。