DeepFM: A Factorization-Machine based Neural Network for CTR Prediction (2017)论文要点

论文链接： https://arxiv.org/pdf/1703.04247.pdf

FM原理参考：

Factorization Machines with libFM 论文阅读 https://www.cnblogs.com/yaoyaohust/p/10225055.html

GBDT，FM，FFM推导 https://www.cnblogs.com/yaoyaohust/p/7865379.html

类别型特征one-hot编码，连续型特征直接表示或者离散化后one-hot编码。

核心思想就是拿FM模型输出的交叉项权重当做embedding使用，FM和Deep分量共用这个embedding。

因此不用预训练（因为整体训练），不用特征工程（因为FM），同时有低阶和高阶交互项（因为FM和NN）。

评估：AUC，LogLoss(cross entropy)

训练快速

激活函数：relu、tanh比sigmoid更常用；而且relu比tanh好（因为减少稀疏性）

Dropout: 0.6-0.9

Neurons per layer: 200-400

最优Hidden layer: 3

network shape: constant（等宽，“中规中矩”）

相关