Practical Data Poisoning Attack against Next-Item Recommendation

概
主要内容

Zhang H., Li Y., Ding B. and Gao J. Practical data poisoning attack against next-item recommendation. International World Wide Web Conferences (WWW), 2020.

概

设计一种 LOKI 的算法, 其伪造一些用户和行为, 使得用这些样本进行训练的推荐模型会偏向某些特定的物品进行推荐.

主要内容

假设所要攻击的推荐系统是个黑盒 (即模型, 参数, 训练方法是未知的); 于是认为地构造一个推荐系统: Recommender Simulator;
利用强化学习 DQN 生成一些伪造的数据;
为了保证这些伪造的数据能够使得模型对某些目标items有偏, 我们需要评估这些数据的影响并作为reward训练DQN;
一种粗劣的方式是每次和原有数据进行一个结合, 然后重新训练 recommender simulator, 显然是非常耗时耗力的;
故我们又引入了 Outcome Estimator 来评估这些伪造的数据的性能. 假设原有数据为 \(\{z_1, \cdots, z_N\}\), 此时最优的参数定义为:

\[\hat{\theta} := \mathop{\arg \min} \limits_{\theta} \frac{1}{N} \sum_{i=1}^N \mathcal{L}(z_i; \theta), \]

此时假设我们引入了一个伪造的数据 \(z_{\delta}\), 则

\[\hat{\theta}_{z_{\delta}}(\epsilon) := \mathop{\arg \min} \limits_{\theta} \frac{1}{N} \sum_{i=1}^N \mathcal{L}(z_i; \theta) + \epsilon \mathcal{L}(z_{\delta}; \theta). \]

自然地, 我们希望考察 \(\hat{\theta}_{z_{\delta}}(\frac{1}{N})\), 以及相应的损失变化量. 通过可知:

\[\frac{d \hat{\theta}_{z_{\delta}}(\epsilon)}{d \epsilon} = -H_{\hat{\theta}}^{-1} \nabla_{\theta} \mathcal{L}(z_{\delta}; \hat{\theta}), \: H_{\hat{\theta}} := \frac{1}{N} \sum_{i=1}^N \nabla_{\theta}^2 \mathcal{L}(z_i; \hat{\theta}), \]

以及

\[\hat{\theta}_{z_{\delta}} (\frac{1}{N}) - \hat{\theta} \approx -\frac{1}{N} H_{\hat{\theta}}^{-1} \nabla_{\theta} \mathcal{L}(z_{\delta}; \hat{\theta}). \\ \]

作者为了进一步判断 \(z_{\delta}\) 对推荐的影响, 定义 prediction score function \(f_{test}\) 用于 DQN 的学习, 则

\[\frac{d f_{test}(z_{u', v'}^{test}; \hat{\theta}_{z_{\delta}})}{d \epsilon} = \frac{d f_{test}(z_{u', v'}^{test}; \hat{\theta})}{d \hat{\theta}_{z_{\delta}}} \cdot \frac{d \hat{\theta}_{z_{\delta}}}{d \epsilon} = - \nabla_{\theta} f_{test} H_{\hat{\theta}}^{-1} \nabla_{\theta} \mathcal{L}(z_{\delta}; \hat{\theta}), \]

其中测试样本 \(z_{u', v'}^{test}\), 我们希望 item \(v'\) 被打高分以推荐给 user \(u'\).

注: 上面只是一个大致的流程,暂时不想了解 DQN, 细节就不讲了.
注: \(H\) 是通过 implicit Hessian-vector products 估计的.

RobustLearning RecommenderSystems 2020 adversarial attack heuristic novel WWW black-box

Practical Data Poisoning Attack against Next-Item Recommendation

概

主要内容

相关

Git--学习笔记（三）远程仓库克隆到本地

全国产化自主可控飞腾4核主板

html标签

洛谷P5340 大中锋的游乐场题解分层图最短路

学习《Python编程从入门到实践》PDF+代码训练

【OF框架】定义框架标准WebApi，按照规范返回状态信息及数据信息

Windows cmd 启动 tomcat 中文乱码问题

有勇气的牛排博客

ValidateTemplate(Label lb2, boolean iflag) {

C# 十六进制八进制前缀或后缀

[Tools] 多媒体视频处理工具FFmpeg

rocketmq入门笔记

标签