Geohash 单元查询 | Elasticsearch: 权威指南 | Elastic
2024-12-24
geohash_cell
查询做的事情非常简单: 把经纬度坐标位置根据指定精度转换成一个 geohash ,然后查找所有包含这个 geohash 的位置——这是非常高效的查询。
GET /attractions/restaurant/_search { "query": { "constant_score": { "filter": { "geohash_cell": { "location": { "lat": 40.718, "lon": -73.983 }, "precision": "2km" } } } } }
此查询将 lat/lon
坐标点转换成对应长度的 geohash —— 本例中为 dr5rsk
—然后查找所有包含这个短语的位置。
然而,如上例中的写法可能不会返回 2km 内所有的餐馆。要知道 geohash 实际上仅是个矩形,而指定的点可能位于这个矩形中的任何位置。有可能这个点刚好落在了 geohash 单元的边缘附近,但过滤器会排除那些落在相邻单元的餐馆。
为了修复这个问题,我们可以通过设置 neighbors
参数为 true
,让查询把周围的单元也包含进来:
GET /attractions/restaurant/_search { "query": { "constant_score": { "filter": { "geohash_cell": { "location": { "lat": 40.718, "lon": -73.983 }, "neighbors": true, "precision": "2km" } } } } }
明显的, 2km
精度的 geohash 加上周围的单元,最终导致一个范围极大的搜索区域。此查询不是为精度而生,但是它非常有效率,而且可以作为更高精度的地理位置过滤器的前置过滤器。
将 precision
参数设置为一个距离可能会有误导性。 2km
的 precision
会被转换成长度为 6 的 geohash 。实际上它的尺寸是约 1.2km x 0.6km。你可能会发现明确的设置长度为 5
或 6
会更容易理解。
此查询的另一个优点是,相比 geo_bounding_box
查询,它支持一个字段中有多个坐标位置的情况。
我们在 优化盒模型 中讨论过,设置 lat_lon
选项也是一个很有效的方式,但是它只在每个字段只有单个坐标点的情况下有效。
官方地址:https://www.elastic.co/guide/cn/elasticsearch/guide/current/geohash-cell-query.html