Skip to main content

嵌入模型

“嵌入模型”经过训练,可以将一段文本转换为向量,之后可以快速与其他向量进行比较,以确定文本片段之间的相似性。嵌入模型通常比大型语言模型(LLMs)小得多,相比之下会非常快速且成本低廉。

在继续中,嵌入是在索引期间生成的,然后由@Codebase用于在您的代码库上执行相似性搜索。

Default model (VS Code only)

transformers.js 在 VS Code 中用作默认的嵌入模型。在 JetBrains 中,目前没有默认设置。

Free Trial

免费试用支持嵌入(提供者:free-trial

如果您有能力使用任何模型,我们推荐voyage-code-3,它与其他嵌入模型选项一起列在下面。

如果你想在本地生成嵌入,我们推荐使用nomic-embed-textOllama

Voyage AI

这里获取API密钥后,您可以这样配置:

config.json
{
"embeddingsProvider": {
"provider": "voyage",
"model": "voyage-code-3",
"apiKey": "<VOYAGE_API_KEY>"
}
}

Ollama

请参阅这里了解如何使用Ollama进行嵌入。

Transformers.js(目前仅限VS Code)

Transformers.js 是流行的 Transformers 库的 JavaScript 版本。它允许完全在本地计算嵌入。使用的模型是 all-MiniLM-L6-v2,该模型与 Continue 扩展一起提供。

config.json
{
"embeddingsProvider": {
"provider": "transformers.js"
}
}

文本嵌入推理

Hugging Face Text Embeddings Inference 使您能够托管自己的嵌入端点。您可以按如下方式配置嵌入以使用您的端点:

config.json
{
"embeddingsProvider": {
"provider": "huggingface-tei",
"apiBase": "http://localhost:8080"
}
}

OpenAI

请参阅这里了解如何使用OpenAI进行嵌入。

Cohere

请参阅这里了解如何使用Cohere进行嵌入。

双子座

请参阅这里了解如何使用Gemini进行嵌入。

顶点

请参阅此处了解如何使用Vertex进行嵌入。

Mistral

请参阅这里了解如何使用Mistral进行嵌入。

NVIDIA

请参阅这里了解如何使用NVIDIA进行嵌入。

基础

请参阅这里了解如何使用Bedrock进行嵌入。

WatsonX

请参阅这里了解如何使用WatsonX进行嵌入。

LMStudio

请参阅这里了解如何使用LMStudio进行嵌入。