在推荐场景中,DIN(深度兴趣网络)和SIM(基于搜索的兴趣模型)等兴趣建模技术表现出色,为个性化推荐系统带来了显著的效果。这些模型能够利用注意力机制来识别用户历史行为与目标物品之间的关联性,然而,当直接将这些模型应用于个性化搜索的精准排序场景时,却会遇到不小的难题。
1. 个性化搜索中的噪声问题
在即时搜索的情境下,并非用户过往的所有活动都能为当前的搜索提供有益的参考。比如,当用户在电商平台上搜索“手机”时,他们之前浏览过的“服装”类别信息可能会引入干扰。传统的兴趣建模技术(例如DIN)虽通过注意力得分来降低无关行为的影响,但并未完全消除这一挑战。尽管DIN的变种ZAM通过引入零向量来降低干扰,而且SIM通过检索策略来筛选出相关的动作,然而,这两种方法都没有明确地构建历史行为与搜索关键词之间的联系。
2. QIN:搜索场景下的长期兴趣建模结构
为了解决上述难题,研究者们提出了名为QIN(Query-aware Interest Network)的模型,该模型的核心在于一个包含两个阶段的检索策略:,
阶段1:基于搜索词的粗筛
在分析用户长期行为记录时,需挑选出与搜索词义紧密相关的子序列。此过程需借助多模态语义向量、搜索索引以及缓存机制等基础设施的支撑。
阶段2:基于目标物品的精筛
在初步筛选结果的基础上,我们还需进一步挑选出与目标商品相匹配的操作。比如,当用户搜索“运动鞋”时,我们应当优先考虑保留那些用户曾经点击或有意购买的同类商品。
3. 多维度注意力机制设计
在描述用户兴趣方面,QIN不仅关注物品ID的匹配程度,而且还会纳入以下各项信息:
属性相关性:例如品牌、价格区间等;
交互深度:如观看时长、点赞、收藏等行为强度信号。
这些数据经过两层非线性网络的处理,以门控机制的形式影响注意力权重,进而辨别用户对不同行为偏好的强弱程度。
4. 行为序列优化与表征融合
去重处理历史重复行为仅保留最新发生的记录,此举可缩减大约10%的冗余信息。
Self-Attention增强经过筛选的子序列之上,我们依据目标物品的相关信息,执行自注意力计算,从而构建出更加精确的用户兴趣特征。
5. 实验效果与行业价值
实验结果表明,QIN在NDCG等排序评估标准上明显超越HEM(层次化兴趣模型)、TEM(时间感知模型)以及ZAM。这一优势主要表现在:
在长尾场景下,单纯依靠ID的注意力得分无法准确把握用户的真实需求,然而,融入属性信息则增强了模型的稳定性。
模型通过分析交互的深度指标,例如观看时间的长短,来辨别用户的“随意点击”和“高度关注”。
总结
QIN的突破性创新主要体现在“两阶段相关性检索”以及“多维度注意力设计”上,这一创新不仅有效解决了噪声干扰的问题,还以简洁的结构满足了搜索场景的具体需求。此理念具有广泛的适用性,可以推广至其他需要精确构建用户兴趣的领域,例如广告推荐和内容分发等。展望未来,可能的研究方向包括开发更高效的行为检索算法,以及构建适用于不同场景的通用兴趣建模框架。
工作时间:8:00-18:00
电子邮件
扫码二维码
获取最新动态