CIKM 2023 | 搜索词主导的用户兴趣网络在搜索排序中的应用

2023年10月17日21:36:47评论160 views字数 3082阅读10分16秒阅读模式

用户的历史行为在推荐领域展示出强大的效果和潜力。用户的历史行为包含各种不同的类型，相比之下，用户的搜索行为更为稀疏。目前大多数的个性化搜索排序方法都使用稀疏的搜索行为来学习具有瓶颈的表示，而未充分建立长期用户兴趣模型。长期兴趣对于即时搜索来说过于多元化，如何有效利用成为一大挑战。

为解决上述问题，我们提出一种以搜索词主导的用户兴趣网络，其中包含两个级联的单元，作用分别是过滤原始用户行为及对不同行为进行赋权。我们特别提出一种相关性检索单元，可根据用户的搜索词，从完整的行为序列中检索出一个子序列，再从该子序列中检索出与目标物品相关的子序列。检索出的物品会输入至混合注意力单元，能对ID和属性计算注意力得分，并根据用户在这些物品上的消费深度自动融合得到的物品 embedding 和内容 embedding。

此方法已在多个公开数据集的离线评估及在线AB测试中得到验证，并已服务于快手搜索的主流量。

CIKM 2023 | 搜索词主导的用户兴趣网络在搜索排序中的应用

论文地址: https://arxiv.org/abs/2310.06444

作者：郭通（快手），李宣平（快手），杨海涛（快手），梁潇（快手），袁勇（快手），侯径幽（快手），柯冰清（快手），张超（快手），何军林（快手），张舜禹（快手）

问题与挑战

个性化搜索排序系统在各类应用场景中发挥着举足轻重的作用，用户通常会明确阐述他们的需求以获取心仪的结果，并与之进行互动。为了提高用户满意度，个性化搜索不仅要注重结果的相关性，还需尽量满足用户的偏好。现有建模用户偏好的方式主要基于用户过去的搜索行为，然而，通过引入用户所有的历史行为（包括在推荐场景中捕捉到的信息），可以更有效地为个性化服务提供搜索结果。

在尝试将推荐场景中塑造用户兴趣的方法迁移到搜索领域时，我们遇到了两大挑战：

如果认定用户在全站的行为作为完整的历史行为，一个可以预见的问题是，完整的行为序列可能并不总是和搜索词相关，直接利用完整的行为历史信息可能会导致负面效果。另一方面，用户历史的搜索行为相对稀疏，这意味着使用这些行为建模包含的信息不够。下图展示了根据真实数据调研的情况，通过追踪过去一段时间内的搜索用户在全站的行为，对比两个场景下他们的行为序列长度。其中横轴是根据用户的活跃度划分的低频(LF)、中频(MF)和高频(HF)用户，低频用户的搜索行为序列长度被缩放到了1，其他等比例。可以看到两者的平均交互物品数量的差距达到20倍。如何在搜索场景下有效利用完整的用户行为面临着挑战。

CIKM 2023 | 搜索词主导的用户兴趣网络在搜索排序中的应用

推荐和搜索的行为构成并不一样。推荐主要涉及用户与物品之间的交互，而搜索则涉及用户与搜索词和物品之间的交互。这导致在给定搜索词的情况下，行为变得特征稀疏，如果只使用物品ID特征，效果可能不太理想，因此需要关注内容属性类特征的使用。另外，如果相似的物品有着不同的用户满意程度，也应该对预测产生不同的贡献。

本文提出了 QIN 模型，该模型包含两个级联的单元：

相关性搜索单元（Relevance Search Unit）：此单元用于过滤与当前查询不相关的历史行为。
混合注意力单元（Fused Attention Unit）：该单元用于建立查询主导的用户兴趣模型，同时对用户的查询和历史行为进行建模，并给予它们不同的权重。此外，该模型还引入了注意力机制来捕捉具有不同满意度的相似物品可能对预测产生不同的贡献。

方法

CIKM 2023 | 搜索词主导的用户兴趣网络在搜索排序中的应用

Relevance Search Unit

这个单元负责过滤不相关的历史行为，而相关又分为 query 相关和 target item 相关。我们根据这两种相关的逻辑，将 RSU 分为两个阶段，第一阶段是根据 query 过滤不相关的历史行为，第二阶段根据 target item筛选更相似的历史行为。接下来将介绍我们计算相似性的方式以及两阶段检索的优势：

Relevance Calculation. 为了把query和 item 链接起来能够计算相似性，我们需要把他们映射到同一空间下，这里我们使用了预训练的向量来表示这些异质的实体。预训练的向量可以用一些公开的大模型生成，而在快手考虑到平台内容的多模态特性，我们实际使用的是一个多模态预训练向量来分别表示 query 和 item。然后他们可以用 cos 相似度计算得到相关性得分。

Search Process. 有了相关性得分，我们可以进行检索。考虑到行为序列中的噪声和过度多样性，第一阶段计算query和item之间的相关性分数，这可以过滤掉大多数不相关的历史行为。它得到的结果表示用户在某个query下的长期兴趣。这个行为子序列包含了不同相关粒度的行为，比如用户在连衣裙下的历史行为可以丰富黄色碎花连衣裙的行为历史，因此相比搜索序列，一阶段的检索大大扩充了序列的长度。

另外，只有一阶段的检索产生的行为序列对不同的 target item 缺乏区分性，因此我们再这个序列的基础上又进行了一次检索。

两阶段的检索在一定程度上扩充了用户搜索行为，当然也会引入噪声，因此我们还需要保证序列在建模时有一定的泛化能力，所以提出了 FAU。