« Index lifecycle management APIs Info API »

› ›

推理API

此功能处于技术预览阶段，可能会在未来的版本中进行更改或移除。Elastic 将努力修复任何问题，但技术预览版中的功能不受官方 GA 功能支持 SLA 的约束。

推理API使您能够使用某些服务，例如内置的机器学习模型（ELSER、E5）、通过Eland上传的模型、Cohere、OpenAI、Azure、Google AI Studio或Hugging Face。对于内置模型和通过Eland上传的模型，推理API提供了一种替代方式来使用和管理训练好的模型。但是，如果您不打算使用推理API来使用这些模型，或者如果您想使用非NLP模型，请使用机器学习训练模型API。

推理API使您能够创建推理端点并使用不同提供商的机器学习模型 - 例如Amazon Bedrock、Anthropic、Azure AI Studio、Cohere、Google AI、Mistral、OpenAI或HuggingFace - 作为服务。使用以下API来管理推理模型并执行推理：

Figure 16. A representation of the Elastic inference landscape

推理端点使您能够使用相应的机器学习模型，而无需手动部署，并通过语义文本在数据摄取时将其应用于您的数据。

从您的提供商中选择一个模型，或者使用由Elastic训练的检索模型ELSER，然后通过创建推理API创建一个推理端点。现在使用语义文本对您的数据执行语义搜索。

	为推理端点提供一个唯一的标识符。`inference_id` 必须是唯一的，并且不能与 `model_id` 匹配。
	The `model_id` 必须是已经通过 Eland 上传的文本嵌入模型的 ID。

	一个有效的 Hugging Face 访问令牌。你可以在你的账户设置页面找到。
	您在 Hugging Face 上创建的推理端点 URL。

	一个有效的Watsonx API密钥。你可以在你的账户的API密钥页面找到。
	您在Watsonx上创建的推理端点URL。
	您的IBM Cloud项目的ID。
	有效的API版本参数。您可以在此处找到活动版本数据参数这里。

推理API

推理API

删除推理API

请求

前提条件

路径参数

查询参数

示例

获取推理API

请求

前提条件

描述

路径参数

示例

执行推理 API

请求

前提条件

描述

路径参数

查询参数

请求体

示例

完成示例

重排序示例

稀疏嵌入示例

文本嵌入示例

创建推理API

请求

先决条件

路径参数

描述

更新推理API

请求

前提条件

描述

路径参数

示例

阿里云AI搜索推理服务

请求

路径参数

请求体

阿里云AI搜索服务示例

Amazon Bedrock 推理服务

请求

路径参数

请求体

Amazon Bedrock 服务示例

Anthropic 推理服务

请求

路径参数

请求体

Anthropic 服务示例

Azure AI 工作室推理服务

请求

路径参数

请求体

Azure AI Studio 服务示例

Azure OpenAI 推理服务

请求

路径参数

请求体

Azure OpenAI 服务示例

Cohere 推理服务

请求

路径参数

请求体

Cohere 服务示例

Elasticsearch 推理服务

请求

路径参数

请求体

通过 elasticsearch 服务进行 E5

通过Elasticsearch服务上传的Eland模型

通过elasticsearch服务为E5设置自适应分配

ELSER 推理服务

请求

路径参数

请求体

ELSER 服务示例

为ELSER服务设置自适应分配

通过 `elasticsearch` 服务进行 E5

通过`elasticsearch`服务为E5设置自适应分配