ElasticSearch集群中的分片查询方式

2020-12-09 leiting (5986阅读)

Es查询的时候默认是随机从一些分片中查询数据，可以通过配置让es从某些分片中查询数据

1：_local

指查询操作会优先在本地节点有的分片中查询，没有的话再在其它节点查询。

2：_primary：指查询只在主分片中查询

3：_primary_first：指查询会先在主分片中查询，如果主分片找不到（挂了），就会在副本中查询。

4：_only_node：指在指定id的节点里面进行查询，如果该节点只有要查询索引的部分分片，就只在这部分分片中查找，所以查询结果可能不完整。如_only_node:123在节点id为123的节点中查询。

5：_prefer_node:nodeid 优先在指定的节点上执行查询

6：Custom (string) value：随机指定一个值就可以。

7：_shards:0,1,2,3,4：查询指定分片的数据

8：自定义：_only_nodes:nodeid1,nodeid2,nodeid3根据多个节点进行查询

Es默认没有提供这种查询方式，所以就只能修改源码了。

首先找到org.elasticsearch.cluster.routing.operation.plain.PlainOperationRouting这个类，es搜索时获取分片信息是通过这个类的。它的preferenceActiveShardIterator()方法就是根据条件来找出响应的分片。

看源码可知其主要是根据preference这个参数来决定取出的分片的。如果没有指定该参数，就随机抽取分片进行搜索。

下面的代码就是根据上面说的不同情况进行的一些判断，使用的switch case语句。

在里面多增加一项ONLY_NODES，这个可以接收多个节点id，这个参数需要配置到preference枚举类中，还要在这个类中的switch判断中判断参数_only_nodes。添加case语句。

接下来就需要完善PlainOperationRouting类中的case语句判断逻辑了。

首先获取传递过来的所有节点id，以逗号分割。获取一个节点id的数组，下面循环判断传递的节点是否存在，如果不存在就抛异常。

下面就返回一个方法的返回值，这个方法是需要我们自己实现的，这个方法可以参考上面的onlyNodeActiveInitializingShardsIt这个方法。

接下来完善onlyNodesActiveShardsIt这个方法，

这样的话就可以从用户指定的多个节点中获取数据。

IT PHP 编程语言开发编程 Linux 科技 Elasticsearch 数据库面试 HTML/CSS/XML 网络 JAVA NoSQL 操作系统 C/C++ Golang Git 算法正则表达式 Redis 互联网 MySql 软件运维 JavaScript 国际架构设计商业 Mac OS TCP/IP Excel Windows Oracle Socket VR Vim MongoDB 运营 Python MemCache 硬件电子娱乐设计摄影 nginx 游戏 WordPress HTTP 团建数码电器 Docker 大模型

略微加速