问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

Elasticsearch字段类型详解：text与keyword的区别与应用场景

创作时间:

作者:

@小白创作中心

Elasticsearch字段类型详解：text与keyword的区别与应用场景

引用

CSDN

等

9

来源

1.

https://blog.csdn.net/qq_50790981/article/details/140080792

2.

https://m.blog.csdn.net/lijingjingchn/article/details/88867635

3.

https://blog.51cto.com/u_12190/10117846

4.

https://blog.51cto.com/u_15714244/10795444

5.

https://www.mianshiya.com/category/Go/question/1827340953891917825

6.

http://www.qhou.site/blog/250;jsessionid=4BAA93B49AAFD7BB722ACF68D63A197C

7.

https://blog.zhaozhouyang.com/2024/01/24/elasticsearch/8-es-structured-search/

8.

https://www.cnblogs.com/tgzhu/p/18528214

9.

https://help.aliyun.com/zh/es/product-overview/8-13-and-8-9-version-instance-performance-test?scm=20140722.H_2804533._.ID_2804533-OR_rec-V_1

在Elasticsearch中，字段类型的选择直接影响查询效率和准确性。其中，text和keyword是最常用的两种字符串类型，它们在使用场景、性能表现等方面存在显著差异。本文将深入探讨这两种类型的特点、区别以及最佳实践。

01

基本定义与特点

text类型主要用于存储需要进行全文搜索的长文本内容。在建立索引前，text类型的字段会被分析器分词，转化为词的组合。这种特性使得text类型非常适合处理文章内容、产品描述等场景，但同时也导致它不支持排序和聚合操作。

keyword类型则用于存储不需要分词的字符串，如用户名、状态码、标签等。它保持字符串的完整性和精确性，支持过滤、排序和聚合操作。keyword类型字段只能用本身来进行检索，不能进行分词处理。

02

使用场景对比

让我们通过具体场景来理解两种类型的应用差异：

文章搜索系统：文章标题和内容应该使用text类型，因为用户可能搜索其中的任意关键词。而发布日期、作者等元信息则适合使用keyword类型，便于精确匹配和排序。
电商商品索引：商品名称、品牌、类别等字段适合使用keyword类型，因为用户往往需要精确匹配。而商品描述则应该使用text类型，以支持全文搜索。

错误的选择会带来严重后果。例如，如果将需要精确匹配的字段设置为text类型，可能会导致查询结果不准确；而将需要全文搜索的字段设置为keyword类型，则会失去分词搜索的能力。

03

性能差异分析

从性能角度来看，text和keyword类型存在显著差异：

查询效率：keyword类型的查询效率通常高于text类型，因为它不需要进行复杂的分词处理。
内存使用：text类型在默认情况下不支持排序和聚合，如果强制开启fielddata功能，会消耗大量内存。而keyword类型则没有这个问题。
索引速度：由于text类型需要进行分词处理，其索引速度通常慢于keyword类型。

在某些特殊场景下，可以通过以下方式优化：

对于需要对text类型字段进行排序或聚合的场景，可以设置fielddata=true，但这种方式会消耗大量内存，不推荐在生产环境使用。
可以通过reindex将text类型字段转换为keyword类型进行统计，但需要注意keyword类型支持的最大长度为32766个UTF-8字符，超过这个长度的数据需要设置ignore_above参数。

04

最佳实践

明确字段用途：在设计索引映射时，首先要明确每个字段的用途。如果需要全文搜索，选择text类型；如果需要精确匹配或聚合，选择keyword类型。
使用多字段映射：对于某些字段，可能同时需要全文搜索和精确匹配的能力。这时可以使用多字段映射，将一个字段同时映射为text和keyword类型。
注意默认类型：如果在创建索引时没有显式指定字段类型，Elasticsearch会自动推断。对于字符串，默认会映射为text类型，这可能导致无法进行精确匹配。
性能优化：对于高查询量的场景，尽量使用keyword类型以提高查询效率。对于需要全文搜索的场景，可以考虑使用更高效的分析器来优化性能。

总结来说，text和keyword这两种字符串类型各有优劣。理解它们的核心差异，根据实际需求做出合理选择，是优化Elasticsearch性能的关键。在设计索引映射时，需要充分考虑字段的使用场景和性能需求，以发挥Elasticsearch的最大效能。

热门推荐

品牌绩效管理的主要指标有哪些？

品牌绩效管理的主要指标有哪些？

用户体验和需求怎么收集

用户体验和需求怎么收集

项目管理培训需求怎么写？从目标设定到效果评估的完整指南

项目管理培训需求怎么写？从目标设定到效果评估的完整指南

天蝎座：性格特点、爱情与职业的影响

天蝎座：性格特点、爱情与职业的影响

GB3836，防爆设备的 “安全准则”

GB3836，防爆设备的 “安全准则”

家装流程全攻略：详细解析每个步骤，避免工期陷阱

家装流程全攻略：详细解析每个步骤，避免工期陷阱

中级工程师评审流程详细步骤-手把手教你避开申报大坑

中级工程师评审流程详细步骤-手把手教你避开申报大坑

配眼镜时散光轴位应如何确定

配眼镜时散光轴位应如何确定

塔罗牌三张牌解读顺序

塔罗牌三张牌解读顺序

垂耳兔为什么不适合饲养？寿命揭秘

垂耳兔为什么不适合饲养？寿命揭秘

换算长度指什么？单位转换规则及公式

换算长度指什么？单位转换规则及公式

江歌案刘鑫吃人血馒头事件的法律评析：责任与道德的边界

江歌案刘鑫吃人血馒头事件的法律评析：责任与道德的边界

诸神的黄昏：北欧神话的独特魅力

诸神的黄昏：北欧神话的独特魅力

不锈钢与铝：有什么区别

不锈钢与铝：有什么区别

红二十五军重建地

红二十五军重建地

电脑看不了视频？教你3招轻松解决！

电脑看不了视频？教你3招轻松解决！

金鲳鱼营养功效与作用金鲳鱼的食用禁忌

金鲳鱼营养功效与作用金鲳鱼的食用禁忌

小组分工都有哪些项目管理

小组分工都有哪些项目管理

法律主体的分类及其主要类型

法律主体的分类及其主要类型

药品说明书，要让患者看得清读得懂

药品说明书，要让患者看得清读得懂

吊顶里灯带怎样放置合适？这种放置方式有哪些技巧？

吊顶里灯带怎样放置合适？这种放置方式有哪些技巧？

夏枣树苗施肥全攻略：从基肥到追肥的科学施用指南

夏枣树苗施肥全攻略：从基肥到追肥的科学施用指南

心理咨询提到的【身份认同】是什么

心理咨询提到的【身份认同】是什么

汽车上常见的几种悬挂，你分清了吗？三分钟教你弄懂！

汽车上常见的几种悬挂，你分清了吗？三分钟教你弄懂！

国有企业绩效考核方案的核心目标是什么？

国有企业绩效考核方案的核心目标是什么？

经济犯罪侦查局的王颖：神秘女侦探的非凡人生

经济犯罪侦查局的王颖：神秘女侦探的非凡人生

外贸人必知：HS编码与商品编码的区别与应用场景

外贸人必知：HS编码与商品编码的区别与应用场景

装甲兵需要具备哪些“硬核”技能？带你近距离看考核现场

装甲兵需要具备哪些“硬核”技能？带你近距离看考核现场

全硫系玻璃超构透镜：微结构化的玻璃表面让长波红外成像元件更轻、更薄

全硫系玻璃超构透镜：微结构化的玻璃表面让长波红外成像元件更轻、更薄

蓝莓吃多了会怎么样

蓝莓吃多了会怎么样

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号