Neural Factorization Machines for Sparse Predictive Analytics

概
主要内容
代码

He X. and Chua T. Neural factorization machines for sparse predictive analytics. In International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2017.

概

引入 B-Interaction Layer 引入二阶的特征交叉, 并通过 MLP 提取 high-order 信息. 和 DeepFM 的区别就是并联和串联的区别?

主要内容

稀疏特征 \(\bm{x}\);
通过 embedding layer 获得:

\[\mathcal{V}_x = \{x_1 \bm{v}_1, x_2 \bm{v}_2, \cdots, x_n \bm{v}_n\}; \]

通过 Bi-Interaction Layer 获得交叉特征:

\[f_{BI}(\mathcal{V}_x) = \sum_{i=1}^n \sum_{j = i + 1} x_i \bm{v}_i \odot x_j \bm{v}_j, \]

其中 \(\odot\) 是 element-wise 乘法;
4. 通过 MLP 获得 high-order 信息:

\[\bm{z}_1 = \sigma_1(W_1 f_{BI}(\mathcal{V}_x) + \bm{b}_1), \\ \bm{z}_2 = \sigma_2(W_2 \bm{z}_1) + \bm{b}_2), \\ \vdots \\ \bm{z}_L = \sigma_L(W_L \bm{z}_{L-1}) + \bm{b}_L). \\ \]

NFM:

\[\hat{y}_{NFM}(\bm{x}) = w_0 + \bm{w}^T\bm{x} + \bm{h}^T \bm{z}_L. \]

如果是预测得分, 可以通过

\[L_{reg} = \sum_{\bm{x} \in \mathcal{X}} (\hat{y}(\bm{x}) - y(\bm{x}))^2 \]

来训练, 如果是分类, 则可以用 log loss ...

代码

[official]
[PyTorch]
[TensorFlow]

RecommenderSystems 2017 CTR emmm FM heuristic SIGIR

Neural Factorization Machines for Sparse Predictive Analytics

概

主要内容

代码

相关

[Tools] 多媒体视频处理工具FFmpeg

Go中的fmt几种输出的区别和格式化方式

uoj316【NOI2017】泳池

sublime text build system automatic ctrl/cmd+B自动选择 python2 或 python3

Emmm，从删库到跑路系列之.......Root权限的重要性

es8（2017）简明汇总

从源码解析Electron的安装为什么这么慢

2017 清北济南考前刷题Day 6 morning

题解 P6345 [CCO 2017]接雨滴

Word2010撤销按钮失效，Ctrl+Z失效解决办法

FMC子卡设计资料第125篇-两路125Msps AD，两路160Msps DA FMC子卡

[NOIP2017 普及组] 跳房子

标签