查询时权重提升 | Elasticsearch: 权威指南 | Elastic
2024-12-24
在 语句优先级(Prioritizing Clauses) 中,我们解释过如何在搜索时使用 boost
参数让一个查询语句比其他语句更重要。
例如:
GET /_search { "query": { "bool": { "should": [ { "match": { "title": { "query": "quick brown fox", "boost": 2 } } }, { "match": { "content": "quick brown fox" } } ] } } }
查询时的权重提升 是可以用来影响相关度的主要工具,任意类型的查询都能接受 boost
参数。
将 boost
设置为 2
,并不代表最终的评分 _score
是原值的两倍;实际的权重值会经过归一化和一些其他内部优化过程。尽管如此,它确实想要表明一个提升值为 2
的句子的重要性是提升值为 1
语句的两倍。
在实际应用中,无法通过简单的公式得出某个特定查询语句的 “正确” 权重提升值,只能通过不断尝试获得。需要记住的是 boost
只是影响相关度评分的其中一个因子;它还需要与其他因子相互竞争。在前例中, title
字段相对 content
字段可能已经有一个 “缺省的” 权重提升值,这因为在 字段长度归一值 中,标题往往比相关内容要短,所以不要想当然的去盲目提升一些字段的权重。选择权重,检查结果,如此反复。
当在多个索引中搜索时,
可以使用参数 indices_boost
来提升整个索引的权重,在下面例子中,当要为最近索引的文档分配更高权重时,可以这么做:
官方地址:https://www.elastic.co/guide/cn/elasticsearch/guide/current/query-time-boosting.html