一、背景
推荐系统中存在数据稀疏性和冷启动问题,对准确有效地建模用户兴趣设置障碍。
跨域推荐是其中一种合适的解决上述挑战的方向,即通过迁移学习技术将知识从信息性推荐场景(源领域)转移到具有稀疏交互的场景(目标领域)。
跨域推荐有两种场景,一种是只关注目标域的效果提升,一般是利用源域丰富的数据提升目标域(稀疏数据)的效果。另一种是两个域的效果都要有提升。本文介绍的方法属于后一种。
二、模型
2.1 问题定义
2.1 overview
2.2 Cross-domain Graph Convolution
2.1.1 embedding的初始化![跨域推荐:基于用户兴趣对齐的跨域推荐 跨域推荐:基于用户兴趣对齐的跨域推荐]()
⊗是最大池化函数(max pooling operation)。
重叠用户的embedding需要初始化对齐,这里采用了各自domain初始化后取每个维度的最大值作为重叠用户的embedding值。文中还采用了sum and averaging等方式,但实验结果没有显著差异。
另外:以前我做过实验,如果重叠用户的embedding初始化不对齐,实验效果会变差,所以对齐是合理的,这里是说只要对齐了,用哪种方式对齐都没有显著差异。
2.1.2 GNN 消息传递机制
对于某个用户的聚合机制如下:
对于所有用户的批处理聚合机制如下:
解读:这里的聚合机制是论文的改进点之一,除了用gcn的聚合机制外,它还对聚合后的emb和原本的emb进行隐式的交叉,获取GNN每一层中更丰富的用户和物品表征。
2.1.3聚合后的用户物品embedding![跨域推荐:基于用户兴趣对齐的跨域推荐 跨域推荐:基于用户兴趣对齐的跨域推荐]()
这里采用了每一层embedding concat的方式作为gnn层最终的embedding表示。其他的方式还有只用最后一层或者所有层的平均。
2.3 User Interest Alignment
以往的方法直接聚合共同用户的embedding,有损用户兴趣的挖掘。
不同的domain数据对共同用户的偏好学习可能是不一致的,例如梯度方向不一致导致共同用户的embedding学习有误差。
所以,用一些辅助的loss对共同用户的embedding学习做一些正则,会有效果。
2.3.1 User-User Alignment
这里是尝试采用用户的二阶邻居作为用户的embedding表示,不同的domain的聚合结果不一样。
这里尝试构建K个兴趣,尝试将不同domain的embedding在同一个兴趣上具有相似性。
采用了soft label的ce loss:
源域和目标域相互拟合,所以有两个loss。
2.3.2 User-Item Alignment
![跨域推荐:基于用户兴趣对齐的跨域推荐 跨域推荐:基于用户兴趣对齐的跨域推荐]()
2.4 Model Optimization
用双塔求用户对item的logit分数
用 BCE loss作为主任务的loss
最后的主任务loss是两个domain的主loss和。
最后的loss是主任务的loss加上两个辅助任务的loss
三、实验结果
3.1 主实验
论文标题:Cross-domain recommendation via user interest alignment论文连接:Zhao, Chuang, et al. "Cross-domain recommendation via user interest alignment." Proceedings of the ACM Web Conference 2023. 2023.代码地址:https://github.com/Data-Designer/COAST
原文始发于微信公众号(风物长宜 AI):跨域推荐:基于用户兴趣对齐的跨域推荐
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论