【GCN-RS】MCL: Mixed-Centric Loss for Collaborative Filtering (WWW‘22)

MCL: Mixed-Centric Loss for Collaborative Filtering (WWW’22)

Pointwise和pairwise损失函数挖掘的信息太少了，只是采样样本，然后更新权重

为了从可用的偏好信息中挖掘更多的信号，考虑了难样本和全局信息。

先采集难样本

$E$ 是欧式距离。

难正样本是指正样本的距离比距离最小的负样本的距离减阈值还要大的样本。
$E_{u j}>\min _{k \in N_{u}} E_{u k}-\epsilon$
难负样本是指负样本的距离比距离最大的正样本的距离加阈值还要小的样本。
$E_{u k}<\max _{j \in P_{u}} E_{u j}+\epsilon$
在这里插入图片描述

混合中心loss (CML)

采集得到的正负样本集合分别为： $\mathrm{P}_{\mathrm{u}}^{\mathrm{s}}, \mathrm{N}_{\mathrm{u}}^{\mathrm{s}}$ 。在训练过程中，给定一个batch B（包含m个用户），定义损失函数：

\begin{aligned} L_{M C L} & = \frac{1}{α} \log [1 + \frac{1}{m} \sum_{u \in B} \sum_{j \in P_{u}^{s}} e^{α (E_{u j} + λ_{p})}] \\ + \frac{1}{β} \log [1 + \frac{1}{m} \sum_{u \in B} \sum_{k \in N_{u}^{s}} e^{- β (E_{u k} + λ_{n})}] \end{aligned}

L_{MC L} = \frac{1}{α} lo g ⎣ ⎡ 1 + \frac{1}{m} u \in B \sum j \in P_{u}^{s} \sum e^{α (E_{u j} + λ_{p})} ⎦ ⎤ + \frac{1}{β} lo g ⎣ ⎡ 1 + \frac{1}{m} u \in B \sum k \in N_{u}^{s} \sum e^{- β (E_{u k} + λ_{n})} ⎦ ⎤

解释为什么设计这个loss，这个loss对于一对正样本的影响：

\begin{aligned} \frac{\partial L}{\partial E_{u j}} = w_{u j}^{+} & = \frac{1}{m} \cdot \frac{e^{α E_{u j}}}{e^{- α λ_{p} + \frac{1}{m}} \sum_{u^{'} \in B} \sum_{i \in P_{u^{'}}^{s}} e^{α E_{u^{'} i}}} \\ = \frac{1}{m} \cdot \frac{1}{w_{1}^{+} (u, j) + w_{2}^{+} (u, j) + w_{3}^{+} (u, j)} \end{aligned}

在这里插入图片描述

用户-物品中心（ $w_1^+$ ）:仅和用户-物品的距离有关，越远 $w_1$ 越小，loss越大。
同类型中心（ $w_2^+$ ）：计算当前正样本物品 $j$ 与用户其他正难样本之间的关系。如果正样本物品 $j$ 与用户的距离比其他难正样本的距离更大，则 $w_1$ 越小，loss越大。这类似于对物品embedding空间加一个约束，希望相同类型物品与用户的距离相似（在embedding空间，同一个用户交互过的物品，围绕在用户附近。）
同批次中心（ $w_3^+$ ）：和同一个batch中的其他用户进行对比，提供了跨用户的额外一致性，希望每个用户和其正样本的距离都相同。

在这里插入图片描述

相关阅读:
6.认识Java的API 使用Java函数库
MySQL字符集大小写不敏感导致的主键冲突问题记录
springcloud高频面试题
聚类算法概念复习
python 基础语法整理
springMvc注解式开发方法以及参数传递方法
【vue3】踩坑日记，vite与node版本对应（mac环境）
口罩问题
剑指 Offer 19. 正则表达式匹配
C#/.NET/.NET Core技术前沿周刊 | 第 5 期（2024年9.9-9.15）

原文地址：https://blog.csdn.net/yanguang1470/article/details/125903380