自己学习机器学习看到逻辑回歸中梯度更新时,始终无法理解更新公式那个看起来很莫名的公式长这样:
为什么要转置,为什么要用乘法将这个矩阵和差异向量相乘下面就来详细讲讲吧。
首先设样本集i行列:
X=??????x11x21…xi1x12x22…xi2…………x1x2…xi??????对应结果标签Y=??????y1y2…yi??????
由於?f(w)/?w需要与?????w1w2…w?????相加,所以?f(w)/?w计算的结果应该是一个行的向量