模糊查询 | Elasticsearch: 权威指南

模糊查询 | Elasticsearch: 权威指南 | Elastic

2026-07-27

请注意:
本书基于 Elasticsearch 2.x 版本，有些内容可能已经过时。

» » »

模糊查询编辑

fuzzy 查询是 term 查询的模糊等价。也许你很少直接使用它，但是理解它是如何工作的，可以帮助你在更高级别的 match 查询中使用模糊性。

为了解它是如何运作的，我们首先索引一些文档：

POST /my_index/my_type/_bulk
{ "index": { "_id": 1 }}
{ "text": "Surprise me!"}
{ "index": { "_id": 2 }}
{ "text": "That was surprising."}
{ "index": { "_id": 3 }}
{ "text": "I wasn't surprised."}

现在我们可以为词 surprize 运行一个 fuzzy 查询：

GET /my_index/my_type/_search
{
  "query": {
    "fuzzy": {
      "text": "surprize"
    }
  }
}

fuzzy 查询是一个词项级别的查询，所以它不做任何分析。它通过某个词项以及指定的 fuzziness 查找到词典中所有的词项。 fuzziness 默认设置为 AUTO 。

在我们的例子中， surprise 比较 surprise 和 surprised 都在编辑距离 2 以内，所以文档 1 和 3 匹配。通过以下查询，我们可以减少匹配度到仅匹配 surprise ：

GET /my_index/my_type/_search
{
  "query": {
    "fuzzy": {
      "text": {
        "value": "surprize",
        "fuzziness": 1
      }
    }
  }
}

提高性能编辑

fuzzy 查询的工作原理是给定原始词项及构造一个 编辑自动机— 像表示所有原始字符串指定编辑距离的字符串的一个大图表。

然后模糊查询使用这个自动机依次高效遍历词典中的所有词项以确定是否匹配。一旦收集了词典中存在的所有匹配项，就可以计算匹配文档列表。

当然，根据存储在索引中的数据类型，一个编辑距离 2 的模糊查询能够匹配一个非常大数量的词项同时执行效率会非常糟糕。下面两个参数可以用来限制对性能的影响：

prefix_length: 不能被 “模糊化” 的初始字符数。大部分的拼写错误发生在词的结尾，而不是词的开始。例如通过将 prefix_length 设置为 3 ，你可能够显著降低匹配的词项数量。
max_expansions: 如果一个模糊查询扩展了三个或四个模糊选项，这些新的模糊选项也许是有意义的。如果它产生 1000 个模糊选项，那么就基本没有意义了。设置 max_expansions 用来限制将产生的模糊选项的总数量。模糊查询将收集匹配词项直到达到 max_expansions 的限制。

« 模糊性模糊匹配查询 »

官方地址：https://www.elastic.co/guide/cn/elasticsearch/guide/current/fuzzy-query.html

有任何技术问题请点击这里网站运营推广招聘

IT PHP 编程语言开发编程 Linux 科技 Elasticsearch 数据库面试 HTML/CSS/XML 网络 JAVA NoSQL 操作系统 C/C++ Golang Git 算法正则表达式 Redis 互联网 MySql 软件运维 JavaScript 国际商业架构设计 Mac OS TCP/IP Excel Windows Oracle Socket VR Vim MongoDB 运营 Python MemCache 硬件电子娱乐设计摄影 nginx 游戏 WordPress HTTP 团建数码电器 Docker 大模型

Elasticsearch集群模式知多少携程Elasticsearch数据同步实践 Elasticsearch是做什么的以及它的使用和基本原理 elasticsearch动态映射 elasticsearch配置 Elasticsearch简介与实战如何配置使用Elasticsearch的动态映射 (dynamic mapping) elasticsearch最新版安装 elasticsearch出现只读索引如何操作 blocked by: [FORBIDDEN/12/index read-only / allow delete (api)];') 【Elasticsearch集群】打分策略详解与explain手把手计算 ElasticSearch自带的分词类型 [Elasticsearch集群分页]from-size VS scroll-scan Elasticsearch集群节点(角色)类型解释node.master和node.data ES查找空字符串 es 相关配置文件两节点Elasticsearch集群 [Elasticsearch] 多字段搜索 (一) - 多个及单个查询字符串 Elasticsearch－基础介绍及索引原理分析安装elasticsearch的java环境确认 ElasticSearch更新后延迟解决方法

略微加速

Elasticsearch权威指南 - 互联网笔记

模糊查询编辑

提高性能编辑

略微加速

Elasticsearch权威指南 - 互联网笔记

模糊查询编辑

提高性能编辑

Getting Started Videos