对梯度下降法的一点理解


梯度下降法:

w= w - α*dw (dw是损失函数J对w的导数)

 在a点时 αdw时负数 w-αdw 一直减小到全局最优解

在b点同理,

损失函数为凸函数,则函数在一点用梯度下降法走到最低点的过程中,梯度一直减小到极值点(最值点)梯度为0,停止迭代;

所以损失函数一般为凸函数。