ElasticSearch查询指南:从基础到高级
创作时间:
作者:
@小白创作中心
ElasticSearch查询指南:从基础到高级
引用
CSDN
1.
https://blog.csdn.net/qq_41879343/article/details/107376190
本文详细介绍了ElasticSearch的基本查询、结果过滤、高级查询、过滤和排序等功能。通过具体的语法示例和解释,帮助读者理解ElasticSearch的各种查询方式和应用场景。
1. 基本查询
1.1 查询所有
- 语法
GET /siyi/_search
{
"query":{
"match_all": {}
}
}
- query:代表查询对象
- match_all:代表查询所有
- took:查询花费时间,单位是毫秒
- time_out:是否超时
- _shards:分片信息
- hits:搜索结果总览对象
- total:搜索到的总条数
- max_score:所有结果中文档得分的最高分
- hits:搜索结果的文档对象数组,每个元素是一条搜索到的文档信息
- _index:索引库
- _type:文档类型
- _id:文档id
- _score:文档的分
- _source:文档的源数据
1.2 匹配查询
- or(或)
match类型查询,会把查询条件进行分词,然后进行查询,多个词条之间是or的关系
GET /siyi/_search
{
"query":{
"match":{
"title":"小米电视"
}
}
}
结果:这样查询与小米相关的都会查询到,多个词之间是or的关系。
- and(且)
某些情况下,我们需要更精确查找,我们希望这个关系变成and,可以这样做:
GET /siyi/_search
{
"query":{
"match": {
"title": {
"query": "小米电视",
"operator": "and"
}
}
}
}
- or和and之间
在or与and间二选一有点过于非黑即白。 如果用户给定的条件分词后有 5 个查询词项,想查找只包含其中 4 个词的文档,该如何处理?将 operator 操作符参数设置成and只会将此文档排除。有时候这正是我们期望的,但在全文搜索的大多数应用场景下,我们既想包含那些可能相关的文档,同时又排除那些不太相关的。换句话说,我们想要处于中间某种结果。
match查询支持minimum_should_match最小匹配参数, 这让我们可以指定必须匹配的词项数用来表示一个文档是否相关。我们可以将其设置为某个具体数字,更常用的做法是将其设置为一个百分数,因为我们无法控制用户搜索时输入的单词数量:
GET /siyi/_search
{
"query":{
"match":{
"title":{
"query":"小米曲面电视",
"minimum_should_match": "75%"
}
}
}
}
本例中,搜索语句可以分为3个词,如果使用and关系,需要同时满足3个词才会被搜索到。这里我们采用最小品牌数:75%,那么也就是说只要匹配到总词条数量的75%即可,这里3*75% 约等于2。所以只要包含2个词条就算满足条件了。
1.3 多字段查询
- multi_match与match类似,不同的是它可以在多个字段中查询
我们会在title字段和subtitle字段中查询小米这个词
GET /siyi/_search
{
"query":{
"multi_match": {
"query": "小米",
"fields": [ "title", "subTitle" ]
}
}
}
1.4 词条匹配
- term查询被用于精确值 匹配,这些精确值可能是数字、时间、布尔或者那些未分词的字符串
GET /siyi/_search
{
"query":{
"term":{
"price":2699.00
}
}
}
1.5 多词条精确匹配
- terms查询和 term 查询一样,但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值,那么这个文档满足条件:
GET /siyi/_search
{
"query":{
"terms":{
"price":[2699.00,2899.00,9999.00]
}
}
}
1.6 query_string
将需要查询的记录先分词再查询。
GET /siyi/goods/_search
{
"query":{
"query_string": {
"default_field": "title",
"query": "手机电视"
}
}
}
2. 结果过滤
默认情况下,elasticsearch在搜索的结果中,会把文档中保存在_source的所有字段都返回。
如果我们只想获取其中的部分字段,我们可以添加_source的过滤
2.1 直接指定字段
GET /siyi/_search
{
"_source": ["title","price"],
"query": {
"term": {
"price": 2699
}
}
}
2.2 指定includes和excludes
我们也可以通过:
- includes:来指定想要显示的字段
- excludes:来指定不想要显示的字段
二者都是可选的。
GET /siyi/_search
{
"_source": {
"includes":["title","price"]
},
"query": {
"term": {
"price": 2699
}
}
}
同样,这样的结果也是一样的。
GET /siyi/_search
{
"_source": {
"excludes": ["images"]
},
"query": {
"term": {
"price": 2699
}
}
}
3. 高级查询
3.1 布尔组合
- bool把各种其它查询通过must(与)、must_not(非)、should(或)的方式进行组合
GET /siyi/_search
{
"query":{
"bool":{
"must": { "match": { "title": "大米" }},
"must_not": { "match": { "title": "电视" }},
"should": { "match": { "title": "手机" }}
}
}
}
3.2 范围查询
- range查询找出那些落在指定区间内的数字或者时间
GET /siyi/_search
{
"query":{
"range": {
"price": {
"gte": 1000.0,
"lt": 2800.00
}
}
}
}
range查询允许以下字符:
操作符 说明
gt 大于
gte 大于等于
lt 小于
lte 小于等于
3.3 模糊查询
- fuzzy查询是term查询的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差,但是偏差的编辑距离不得超过2:
GET /siyi/_search
{
"query": {
"fuzzy": {
"title": "appla"
}
}
}
上面的查询,也能查询到apple手机
我们可以通过fuzziness来指定允许的编辑距离:
GET /siyi/_search
{
"query": {
"fuzzy": {
"title": {
"value":"appla",
"fuzziness":1
}
}
}
}
4. 过滤
- 条件查询中进行过滤
所有的查询都会影响到文档的评分及排名。如果我们需要在查询结果中进行过滤,并且不希望过滤条件影响评分,那么就不要把过滤条件作为查询条件来用。而是使用filter方式:
GET /siyi/_search
{
"query":{
"bool":{
"must":{ "match": { "title": "小米手机" }},
"filter":{
"range":{"price":{"gt":2000.00,"lt":3800.00}}
}
}
}
}
注意:
filter中还可以再次进行bool组合条件过滤。
- 无查询条件,直接过滤
如果一次查询只有过滤,没有查询条件,不希望进行评分,我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的,但对于提高查询简洁性和清晰度有很大帮助。
GET /siyi/_search
{
"query":{
"constant_score": {
"filter": {
"range":{"price":{"gt":2000.00,"lt":3000.00}}
}
}
}
}
5. 排序
5.1 单字段排序
- sort可以让我们按照不同的字段进行排序,并且通过order指定排序的方式
GET /siyi/_search
{
"query": {
"match": {
"title": "小米手机"
}
},
"sort": [
{
"price": {
"order": "desc"
}
}
]
}
5.2 多字段排序
- 假定我们想要结合使用 price和 _score(得分) 进行查询,并且匹配的结果首先按照价格排序,然后按照相关性得分排序:
GET /siyi/goods/_search
{
"query":{
"bool":{
"must":{
"match": {
"title": "小米手机"
}
}
}
},
"sort": [
{ "price": { "order": "desc" }},
{ "_score": { "order": "desc" }}
]
}
本文原文来自CSDN
热门推荐
洛川打造苹果产业“智能生态圈”,356家企业集聚发展
红细胞偏高?吃货指南来了!
深圳儿童乘车卡办理全攻略:一文详解办理条件、流程及优惠
揭秘春秋战国:孙膑——从“疯疯癫癫”到军事奇才的蜕变
鸡腿烹饪大全:五种风味的详细制作攻略
冬季蚌埠到三门峡高铁攻略:车次时间与安全提醒
橡木家具,稳如泰山的秘密
尾骨撞击后长期疼痛怎么办?骨科专家教你这样缓解
冬季取暖账单爆表?教你几招省电妙计
韩红与李延亮:一段跨越38年的初恋
天山雪莲养生酒:温肾助阳功效好,这些人要慎用
解表退热又疏肝,狭叶柴胡的六大功效与应用
专家推荐:5种有效控制糖尿病尿蛋白高的治疗方案
办公设备大全:选择与采购指南
低GI水果、醋和酸奶:餐前这样吃,血糖更平稳
中老年人补充辅酶Q10:每日剂量与注意事项
麻辣鲜香,四川冷吃兔的味觉密码
第一版欧元纸币正面左边水印图案由什么组成
水溶肥、叶面肥、有机肥……番茄种植这样施肥产量高
片仔癀保质期:锭剂5年胶囊3年,过期使用有风险
巨蟹座女孩秋冬穿搭指南:温柔气质爆棚
巨蟹座女孩颜值第九?别急,真正吸引人的不是外貌!
男生配音必修课:从认识声音到掌握配音技巧
冬季空气能热泵高效维护技巧
冬季养生必做:花椒泡脚的功效与方法全解析
新疆旅游必去的十大景区
匠心打造故宫四季,金属书签展现皇家园林之美
研究发现:服用铁剂前后1小时勿饮豆浆
呋塞米片治疗心力衰竭:作用机制、用量及注意事项
新技术让蔬菜增产最高达300%,气肥和芸苔素成增产利器