› ›

字段数据类型

每个字段都有一个字段数据类型，或字段类型。这个类型指示了字段包含的数据种类，例如字符串或布尔值，以及其预期用途。例如，您可以将字符串索引到text和keyword字段中。然而，text字段值会进行分析以进行全文搜索，而keyword字符串则保持原样以进行过滤和排序。

字段类型按家族分组。同一家族中的类型具有完全相同的搜索行为，但可能在空间使用或性能特征上有所不同。

目前，有两种类型家族，keyword 和 text。其他类型家族只有一个字段类型。例如，boolean 类型家族由一个字段类型组成：boolean。

	The `tags` 字段是动态添加为 `string` 字段。
	The `lists` 字段是动态添加为 `object` 字段。
	第二个文档不包含数组，但可以索引到相同的字段中。
	查询在`tags`字段中查找`elasticsearch`，并匹配两个文档。

`doc_values`	该字段是否应以列步长的方式存储在磁盘上，以便以后可以用于排序、聚合或脚本编写？接受 `true` 或 `false`（默认）。对于TSDB索引（将 `index.mode` 设置为 `time_series` 的索引），此参数将自动设置为 `true`。
`store`	字段值是否应与`_source`字段分开存储和检索。接受`true`或`false`（默认）。

假值	`false`, `"false"`, `""`（空字符串）
真值	`true`, `"true"`

	将文档索引为`"true"`，这被解释为`true`。
	搜索包含JSON `true`的文档。

`doc_values`	字段是否应以列步长的方式存储在磁盘上，以便以后可以用于排序、聚合或脚本？接受 `true`（默认）或 `false`。
`index`	字段是否应快速可搜索？接受 `true`（默认）和 `false`。仅启用了 `doc_values` 的字段仍然可以使用术语或基于范围的查询进行查询，尽管速度较慢。
`ignore_malformed`	尝试将错误的数据类型索引到字段中会默认抛出异常，并拒绝整个文档。如果此参数设置为true，则允许忽略该异常。格式错误的字段不会被索引，但文档中的其他字段会正常处理。接受`true`或`false`。请注意，如果使用了`script`参数，则无法设置此参数。
`null_value`	接受上述任何真或假值。该值将替换任何显式的 `null` 值。默认为 `null`，这意味着该字段被视为缺失。请注意，如果使用了 `script` 参数，则不能设置此项。
`on_script_error`	定义如果在索引时由`script`参数定义的脚本抛出错误时应执行的操作。接受`fail`（默认），这将导致整个文档被拒绝，以及`continue`，这将把字段注册在文档的`_ignored`元数据字段中并继续索引。此参数只能在设置了`script`字段时设置。
`脚本`	如果设置了此参数，则该字段将索引由此脚本生成的值，而不是直接从源中读取值。如果在输入文档上为此字段设置了值，则文档将被拒绝并显示错误。脚本的格式与其运行时等效项相同。
`store`	字段值是否应与`_source`字段分开存储和检索。接受`true`或`false`（默认）。
`meta`	字段的元数据。
`时间序列维度`	(可选, 布尔值) 将字段标记为时间序列维度。默认为`false`。 `index.mapping.dimension_fields.limit` 索引设置限制了索引中的维度数量。维度字段具有以下约束： `doc_values` 和 `index` 映射参数必须为 `true`。

`analyzer`	要使用的索引分析器，默认为 `简单`。
`search_analyzer`	要使用的搜索分析器，默认为 `analyzer` 的值。
`保留分隔符`	保留分隔符，默认为 `true`。如果禁用，你可能会找到一个以 `Foo Fighters` 开头的字段，如果你建议为 `foof`。
`preserve_position_increments`	启用位置增量，默认为 `true`。如果禁用并使用停用词分析器，您可能会得到一个以 `The Beatles` 开头的字段，如果您建议 `b`。注意：您也可以通过索引两个输入 `Beatles` 和 `The Beatles` 来实现这一点，如果您能够丰富您的数据，则无需更改简单的分析器。
`max_input_length`	限制单个输入的长度，默认为 `50` 个 UTF-16 代码点。此限制仅在索引时使用，以减少每个输入字符串的总字符数，从而防止大量输入导致底层数据结构膨胀。大多数用例不会受到默认值的影响，因为前缀补全很少会超出几个字符长的前缀。

	The `date` 字段使用默认的 `format`。
	本文档使用一个简单的日期。
	本文档包含一个时间。
	本文档使用自纪元以来的毫秒数。
	请注意，返回的 `sort` 值都是自纪元以来的毫秒数。

`doc_values`	字段是否应以列步长的方式存储在磁盘上，以便以后可以用于排序、聚合或脚本？接受 `true`（默认）或 `false`。
`format`	可以解析的日期格式。默认为 `strict_date_optional_time\|\|epoch_millis`。
`区域设置`	用于解析日期时的区域设置，因为不同语言中月份的名称和/或缩写不同。默认值为英语。
`ignore_malformed`	如果 `true`，格式错误的数字将被忽略。如果 `false`（默认），格式错误的数字将抛出异常并拒绝整个文档。请注意，如果使用了 `script` 参数，则无法设置此选项。
`index`	该字段是否应快速可搜索？接受 `true`（默认）和 `false`。仅启用了 `doc_values` 的日期字段也可以查询，尽管速度较慢。
`null_value`	接受以配置的 `format` 之一表示的日期值作为字段，该字段将替换任何显式的 `null` 值。默认为 `null`，这意味着该字段被视为缺失。请注意，如果使用了 `script` 参数，则无法设置此项。
`on_script_error`	定义如果在索引时由`script`参数定义的脚本抛出错误时应执行的操作。接受`fail`（默认），这将导致整个文档被拒绝，以及`continue`，这将把字段注册在文档的`_ignored`元数据字段中并继续索引。此参数只能在设置了`script`字段时设置。
`脚本`	如果设置了此参数，则该字段将索引由此脚本生成的值，而不是直接从源读取值。如果在输入文档上为此字段设置了值，则文档将被拒绝并返回错误。脚本的格式与其运行时等效相同，并且应发出长值时间戳。
`store`	字段值是否应与`_source`字段分开存储和检索。接受`true`或`false`（默认）。
`meta`	字段的元数据。

	表示40位维度向量的5个字节
	一个表示40位维度向量的十六进制字符串

`depth_limit`	展平对象字段允许的最大深度，以嵌套内部对象的形式表示。如果展平对象字段超过此限制，则会抛出错误。默认值为`20`。请注意，`depth_limit`可以通过更新映射 API动态更新。
`doc_values`	字段是否应以列步长的方式存储在磁盘上，以便以后可以用于排序、聚合或脚本？接受 `true`（默认）或 `false`。
`eager_global_ordinals`	是否应在刷新时急切加载全局序数？接受 `true` 或 `false`（默认）。在频繁用于词条聚合的字段上启用此功能是一个好主意。
`ignore_above`	超过此限制的叶子值将不会被索引。默认情况下，没有限制，所有值都会被索引。请注意，此限制适用于扁平化对象字段中的叶子值，而不是整个字段的长度。
`index`	确定字段是否应可搜索。接受 `true`（默认）或 `false`。
`index_options`	在评分目的中，索引中应存储哪些信息。默认值为 `docs`，但也可以设置为 `freqs`，以便在计算分数时考虑词频。
`null_value`	一个字符串值，用于替换扁平化对象字段中任何显式的 `null` 值。默认为 `null`，这意味着 null 字段被视为缺失。
`similarity`	使用哪种评分算法或相似度。默认为`BM25`。
`split_queries_on_whitespace`	是否应在为此字段构建查询时，将全文查询的输入在空白处拆分。接受`true`或`false`（默认）。
`时间序列维度`	(可选，字符串数组) 扁平化对象内的字段列表，其中每个字段是时间序列的一个维度。每个字段使用从根字段开始的相对路径指定，并且不包括根字段名称。

	以对象形式表示的地理点，采用GeoJSON格式，包含`type`和`coordinates`键。
	以Well-Known Text表示的地理点格式为：`"POINT(lon lat)"`
	以对象表示的地理点，包含`lat`和`lon`键。
	地理点表示为一个数组，格式为：[ `lon`, `lat`]
	以字符串形式表示的地理点，格式为：`"纬度,经度"`。
	以geohash表示的地理点。
	一个地理边界框查询，用于查找所有位于该框内的地理点。

`ignore_malformed`	如果`true`，格式错误的geopoints将被忽略。如果`false`（默认），格式错误的geopoints将抛出异常并拒绝整个文档。 geopoint被认为是格式错误的情况是，其纬度超出范围-90 ⇐ 纬度 ⇐ 90，或者其经度超出范围-180 ⇐ 经度 ⇐ 180。请注意，如果使用了`script`参数，则无法设置此项。
`ignore_z_value`	如果为`true`（默认），将接受三维点（存储在源中），但仅索引纬度和经度值；忽略第三维度。如果为`false`，包含超过纬度和经度（二维）值的地理点将抛出异常并拒绝整个文档。请注意，如果使用了`script`参数，则无法设置此项。
`index`	字段是否应快速可搜索？接受 `true`（默认）和 `false`。仅启用了 `doc_values` 的字段仍然可以查询，尽管速度较慢。
`null_value`	接受一个地理点值，该值将替换任何显式的 `null` 值。默认值为 `null`，这意味着该字段被视为缺失。请注意，如果使用了 `script` 参数，则不能设置此项。
`on_script_error`	定义如果在索引时由`script`参数定义的脚本抛出错误时应执行的操作。接受`fail`（默认），这将导致整个文档被拒绝，以及`continue`，这将把字段注册在文档的`_ignored`元数据字段中并继续索引。此参数只能在设置了`script`字段时设置。
`脚本`	如果设置了此参数，则该字段将索引由此脚本生成的值，而不是直接从源中读取值。如果在输入文档上为此字段设置了值，则文档将被拒绝并返回错误。脚本格式与其运行时等效相同，并且应发出一对(lat, lon)双精度值。

Option	Description	Default
`方向`	可选。字段的WKT多边形的默认方向。此参数设置并返回仅一个`RIGHT`（逆时针）或`LEFT`（顺时针）值。然而，您可以通过多种方式指定任一值。要设置`RIGHT`，请使用以下参数之一或其大写变体： `右` `逆时针` `逆时针` 要设置`LEFT`，请使用以下参数之一或其大写变体： `左` `顺时针` `顺时针`	`RIGHT`
`ignore_malformed`	如果为真，格式错误的GeoJSON或WKT形状将被忽略。如果为假（默认），格式错误的GeoJSON和WKT形状将抛出异常并拒绝整个文档。	`假`
`ignore_z_value`	如果为`true`（默认），将接受三维点（存储在源中），但仅索引纬度和经度值；第三维度被忽略。如果为`false`，则包含超过纬度和经度（二维）值的地理点将抛出异常并拒绝整个文档。	`真`
`coerce`	如果 `true`，多边形中未闭合的线性环将自动闭合。	`假`
`索引`	字段是否应该快速可搜索？接受 `true`（默认）和 `false`。仅启用了 `doc_values` 的字段仍然可以查询，尽管速度较慢。	`真`
`doc_values`	字段是否应以列步长的方式存储在磁盘上，以便以后可以用于聚合或脚本编写？	`真`

GeoJSON Type	WKT Type	Elasticsearch Type	Description
`点`	`点`	`点`	一个地理坐标。注意：Elasticsearch仅使用WGS-84坐标。
`LineString`	`LINESTRING`	`linestring`	给定两个或更多点的一条任意线。
`多边形`	`多边形`	`多边形`	一个闭合的多边形，其第一个和最后一个点必须匹配，因此需要`n + 1`个顶点来创建一个`n`边形，并且最少需要`4`个顶点。
`多点`	`多点`	`多点`	一组未连接但可能相关的点。
`多线串`	`MULTILINESTRING`	`多线串`	一组独立的线串。
`多边形集合`	`MULTIPOLYGON`	`多边形集合`	一个由多个独立多边形组成的数组。
`GeometryCollection`	`GEOMETRYCOLLECTION`	`几何集合`	一个类似于`multi*`形状的GeoJSON形状，不同之处在于多种类型可以共存（例如，一个点和一个线串）。
`N/A`	`BBOX`	`信封`	一个边界矩形，或信封，通过仅指定左上角和右下角点来指定。

	每个桶的值。数组中的值被视为双精度数，并且必须按递增顺序给出。对于T-Digest直方图，此值表示平均值。在HDR直方图的情况下，这表示迭代到的值。
	每个桶的计数。数组中的值被视为长整数，并且必须为正数或零。负值将被拒绝。桶与计数之间的关系由数组中的位置给出。

	字段的名称
	定义一个单一关系，其中`question`是`answer`的父级。

	路由值是强制性的，因为父文档和子文档必须索引在同一个分片上
	`answer` 是此文档的连接名称
	这个子文档的父ID

	本文档属于 `question` 连接
	本文档属于 `question` 连接
	本文档属于 `answer` 连接
	子文档的链接父ID

	查询 `parent id` 字段（另请参阅 `has_parent` 查询和 `has_child` 查询）
	在`父ID`字段上进行聚合（另请参阅`子`聚合）
	在脚本中访问`父ID`字段。

	`question` 是 `answer` 和 `comment` 的父级
	`answer` 是 `vote` 的父级

	这个子文档必须与其祖父文档和父文档位于同一个分片上
	此文档的父ID（必须指向一个`answer`文档）

`meta`	字段的元数据。
`值`	与索引中所有文档关联的值。如果未提供此参数，则根据第一个被索引的文档设置。

`null_value`	接受一个字符串值，该值将替换任何显式的 `null` 值。默认为 `null`，这意味着该字段被视为缺失。
`ignore_above`	不要索引任何长度超过此值的字符串。默认值为 `2147483647`，以便接受所有值。

	The `user` 字段被映射为 `nested` 类型，而不是 `object` 类型。
	此查询不匹配，因为 `Alice` 和 `Smith` 不在同一个嵌套对象中。
	此查询匹配，因为 `Alice` 和 `White` 在同一个嵌套对象中。
	`inner_hits` 允许我们突出显示匹配的嵌套文档。

字段数据类型

字段数据类型

常见类型

对象和关系类型

结构化数据类型

聚合数据类型

文本搜索类型

文档排名类型

空间数据类型

其他类型

数组

多字段

聚合指标字段类型

aggregate_metric_double 字段的参数

用途

示例

综合 _source

别名字段类型

别名目标

不支持的API

数组

对象数组

二进制字段类型

binary 字段的参数

合成 _source

布尔字段类型

布尔字段的参数

合成 _source

完成字段类型

用于completion字段的参数

日期字段类型

多种日期格式

date 字段的参数

纪元秒

合成 _source

日期纳秒字段类型

限制

合成 _source

密集向量字段类型

用于kNN搜索的索引向量

自动量化向量以进行kNN搜索

密集向量字段的参数

合成 _source

索引与搜索位向量

可更新的字段类型

展平字段类型

支持的操作

检索扁平化字段

扁平化对象字段的参数

合成 _source

地理点字段类型

以数组或字符串表示的地理点

geo_point 字段的参数

在脚本中使用地理点

合成源

地理形状字段类型

映射选项

索引方法

示例

输入结构

点

线串

多边形

多边形方向

多点

多线串

多边形集合

几何集合

信封

圆形

排序和检索索引形状

合成源

直方图字段类型

用途

构建直方图

合成 _source

示例

IP 字段类型

ip 字段的参数

查询 ip 字段

`aggregate_metric_double` 字段的参数

综合 `_source`

`binary` 字段的参数

合成 `_source`

合成 `_source`

用于`completion`字段的参数

`date` 字段的参数

合成 `_source`

合成 `_source`

合成 `_source`

合成 `_source`

`geo_point` 字段的参数

合成 `_source`

`ip` 字段的参数

查询 `ip` 字段

合成 `_source`

合成 `_source`

合成 `_source`

使用 `nested` 字段处理对象数组

与`嵌套`文档交互

关于`嵌套`映射和对象的限制

参数为 `scaled_float`

`scaled_float` 饱和度

合成 `_source`

用于`passthrough`字段的参数

`point` 字段的参数

合成 `_source`

特定于 `search_as_you_type` 字段的参数

合成 `_source`

`semantic_text` 字段的参数

`semantic_text` 结构

`长整型`	一个有符号的64位整数，最小值为 `-2⁶³`，最大值为 `2⁶³-1`。
`整数`	一个有符号的32位整数，最小值为 `-2³¹`，最大值为 `2³¹-1`。
`短整型`	一个有符号的16位整数，最小值为 `-32,768`，最大值为 `32,767`。
`字节`	一个有符号的8位整数，最小值为`-128`，最大值为`127`。
`双精度`	一个双精度64位IEEE 754浮点数，限制为有限值。
`浮点数`	一个单精度32位IEEE 754浮点数，限制为有限值。
`半浮点数`	一个半精度16位IEEE 754浮点数，限制为有限值。
`scaled_float`	一个由 `long` 支持的浮点数，通过固定的 `double` 缩放因子进行缩放。
`无符号长整型`	一个无符号的64位整数，最小值为0，最大值为`2⁶⁴-1`。

Type	Minimum value	Maximum value	Significant bits / digits	Example precision loss
`双精度`	`2^-1074`	`(2-2^-52)·2¹⁰²³`	`53` / `15.95`	`1.2345678912345678`→ `1.234567891234568`
`浮点数`	`2^-149`	`(2-2^-23)·2¹²⁷`	`24` / `7.22`	`1.23456789`→ `1.2345679`
`半浮点数`	`2^-24`	`65504`	`11` / `3.31`	`1.2345`→ `1.234375`

	外部文档也是一个JSON对象。
	它包含一个名为 `manager` 的内部对象。
	其中包含一个名为 `name` 的内部对象。

	顶级映射定义中的属性。
	The `manager` 字段是一个内部 `object` 字段。
	The `manager.name` 字段是 `manager` 字段内的一个内部 `object` 字段。

`dynamic`	是否应将新`属性`动态添加到现有对象。接受`true`（默认）、`runtime`、`false` 和`strict`。
`enabled`	对象字段给出的JSON值是否应被解析并索引（`true`，默认）或完全忽略（`false`）。
`subobjects`	对象是否可以包含子对象（`true`，默认）或不可以（`false`）。如果不可以，名称中带有点的子字段将被视为叶子节点，否则它们的字段名称将被扩展为其对应的对象结构。
`properties`	对象中的字段可以是任何数据类型，包括 `对象`。可以向现有对象添加新属性。

	对象被定义为透传。其优先级（必需）用于冲突解决。
	对象内容按常规方式进行索引，包括动态映射。
	子字段可以在查询中引用，就像它们在根级别定义一样。
	子字段也可以被引用，包括对象名称作为前缀。

`priority`	(必需) 用于解决透传字段之间的命名冲突。值最高的字段获胜。接受非负整数值。
`time_series_dimension`	是否将子字段视为时间序列维度。接受 `false`（默认）或 `true`。
`dynamic`	是否应将新`属性`动态添加到现有对象。接受`true`（默认）、`runtime`、`false`和`strict`。
`enabled`	对象字段给出的JSON值是否应被解析并索引（`true`，默认）或完全忽略（`false`）。
`properties`	对象中的字段可以是任何数据类型，包括`对象`。可以向现有对象添加新属性。

	仅在索引时生成前缀标记的分析器。
	根据您的前缀搜索需求，增加`min_gram`并减少`max_gram`设置。
	此多字段应用于使用 `term` 或 `match` 查询进行前缀搜索，而不是使用 `prefix` 或 `wildcard` 查询。

	点表示为一个对象，采用GeoJSON格式，包含`type`和`coordinates`键。
	点表示为Well-Known Text 格式为：`"POINT(x y)"`
	点表示为一个对象，包含`x`和`y`键。
	点表示为数组，格式为：[ `x`, `y`]
	点表示为字符串，格式为：`"x,y"`。

`ignore_malformed`	如果`true`，格式错误的点将被忽略。如果`false`（默认），格式错误的点将抛出异常并拒绝整个文档。
`ignore_z_value`	如果为`true`（默认值），将接受三维点（存储在源中），但仅索引x和y值；忽略第三维度。如果为`false`，则包含超过x和y（二维）值的点将抛出异常并拒绝整个文档。
`null_value`	接受一个点值，该值将替换任何显式的 `null` 值。默认为 `null`，这意味着该字段被视为缺失。