Query 扩展 (电商领域)
关键词
query expansion (查询扩展), query rewriting (查询重写/改写)
概述
查询扩展的目的:
弥合 query 和 doc 之间的词汇差距 (vocabulary gap), 比如拼写错误 (miss-spelling), 描述同义实体的不同方式 (different ways of describing the same entity);
在电子商务 (e-commerce) 领域, 用户 query 通常更短且口语化, 而产品标题通常更冗长且包含正式术语;
示例: query = "noise absorbing blankets" (吸音地毯), rewriting = "acoustic blankets" (声学地毯), "soundproof blankets" (隔音毯), "soundproof blanket"
Query 扩展的一般过程:
离线阶段, token 维度挖掘同义词;
在线阶段, 对 query 进行改写;
基于同义词的 query 扩展
示例
query: men bikes
synonyms: {men, mens}, {bike, bicycle}
recall: men OR bikes => ((men OR mens) AND (bike OR bicycle)
同义词挖掘
基于预训练语言模型的 query 扩展
参考阅读
Last updated