24小时热门版块排行榜    

查看: 2920  |  回复: 3
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

pluiefox

新虫 (初入文坛)

[求助] 复合函数的矩阵求导 已有1人参与


问题如图。
我看过论坛里其他类似的对矩阵求导的讨论,我的问题是:

  1. 导数表示形式的分子布局、分母布局何时使用以及在同一个方程中能否混合使用,如果可以,什么样的情况下才需要选择特定的表示形式?
  2. 我在维基百科Matrix  calculus词条中看到这样一句话:
    引用回帖:
    The chain rule applies in some of the cases, but unfortunately does not apply in matrix-by-scalar derivatives or scalar-by-matrix derivatives (in the latter case, mostly involving the trace operator applied to matrices).

    这样的话,那么所给图片里红色式子左边部分的链式法则的应用就是错的。以图片中求为例,我应该如何对涉及矩阵的复合函数求导?


这个问题,是在求解神经网络的参数梯度的时候遇到的,为了简化问题我表述成了上述形式。
因为目标函数比较复杂,如果按矩阵元素推导会很麻烦,所以我直接对矩阵求导,但是我尝试写代码的时候才发现了这个无法相乘的问题。
我看到一些文章提到可以利用张量求列向量对矩阵的导数,但没有更进一步的解释了。
如果有描述模糊和不正确的地方,麻烦指正,我会及时修改。谢谢大家了!
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zaq123321

专家顾问 (著名写手)

What's the matrix norm in J

[ 发自手机版 http://muchong.com/3g ]
小木虫给我温暖,给我希望,爱就要爱小木虫。
2楼2015-11-04 00:09:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zaq123321

专家顾问 (著名写手)

【答案】应助回帖

感谢参与,应助指数 +1
引用回帖:
3楼: Originally posted by pluiefox at 2015-11-04 09:45:10
J 是  的二范数的平方再乘以二分之一,为了简化问题可以把 J 重新定义为:
J = ||p||,即 J 为 p 的一范数,系数全为1的p的分量的线性组合。
对于改过的式子,我按元素推导,先得到了{∂J / ∂Wij},这 ...

You can write out the squared vector norm as inner product   f=<a, a>=a^Ta.
Here a=(VW-I)(c_1, c_2).
Then df/dW = 2*<a, da/dW>  
You can find how to calculate da/dW from matrix calculus website and get answer.
小木虫给我温暖,给我希望,爱就要爱小木虫。
4楼2015-11-04 10:32:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 pluiefox 的主题更新
信息提示
请填处理意见