0%

Softmax推导过程

1. 介绍

Softmax其实就是logstic回归的多类版本。

2. 推导过程

D 是x数据维度,也是$w_j$的维度。N是train example个数。k是分类数目

求梯度以及更新过程:

下面是中间计算过程

这里$\textbf{1}\{y_i = j\} - \hat p(y_i = j \vert x_i ; W)$是scalar然后$x_i$是一个向量。


因为我们是朋友,所以你可以使用我的文字,但请注明出处:http://alwa.info