Bootstrap

Elasticsearch filter vs. query 对比

Elasticsearch filter vs. query,文字内容来自 B 站中华石杉 Elasticsearch 顶尖高手系列课程核心知识篇,英文内容来自官方文档。

filter 与 query 示例

测试数据准备:

PUT /employee/_doc/1
{
  "address": {
    "country": "china",
    "province": "jiangsu",
    "city": "nanjing"
  },
  "name": "tom",
  "age": 30,
  "join_date": "2016-01-01"
}

PUT /employee/_doc/2
{
  "address": {
    "country": "china",
    "province": "shanxxi",
    "city": "xian"
  },
  "name": "marry",
  "age": 35,
  "join_date": "2015-01-01"
}

搜索请求:年龄必须大于等于30,同时join_date必须是2016-01-01

GET /employee/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "join_date": "2016-01-01"
          }
        }
        ],
        "filter": {
          "range": {
            "age": {
              "gte": 30
            }
          }
        }
    }
  }
}
filter 与 query 对比

  • filter,仅仅只是按照搜索条件过滤出需要的数据而已,不计算任何相关度分数,对相关度没有任何影响

  • query,会去计算每个document相对于搜索条件的相关度,并按照相关度进行排序。

一般来说,如果你是在进行搜索,需要将最匹配搜索条件的数据先返回,那么用query;如果你只是要根据一些条件筛选出一部分数据,不关注其排序,那么用filter。

除非是你的这些搜索条件,你希望越符合这些搜索条件的document越排在前面返回,那么这些搜索条件要放在query中;如果你不希望一些搜索条件来影响你的document排序,那么就放在filter中即可

filter 与 query 性能

  • filter,不需要计算相关度分数,不需要按照相关度分数进行排序,同时还有内置的自动cache最常使用filter的数据

  • query,要计算相关度分数,按照分数进行排序,而且无法cache结果

那么简单来说,一般情况下 filter 可能会更快一些,但是没有办法对结果进行排序,filter 和 query 有各自的使用场景。