24小时热门版块排行榜    

查看: 2994  |  回复: 3
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

pluiefox

新虫 (初入文坛)

[求助] 复合函数的矩阵求导 已有1人参与


问题如图。
我看过论坛里其他类似的对矩阵求导的讨论,我的问题是:

  1. 导数表示形式的分子布局、分母布局何时使用以及在同一个方程中能否混合使用,如果可以,什么样的情况下才需要选择特定的表示形式?
  2. 我在维基百科Matrix  calculus词条中看到这样一句话:
    引用回帖:
    The chain rule applies in some of the cases, but unfortunately does not apply in matrix-by-scalar derivatives or scalar-by-matrix derivatives (in the latter case, mostly involving the trace operator applied to matrices).

    这样的话,那么所给图片里红色式子左边部分的链式法则的应用就是错的。以图片中求为例,我应该如何对涉及矩阵的复合函数求导?


这个问题,是在求解神经网络的参数梯度的时候遇到的,为了简化问题我表述成了上述形式。
因为目标函数比较复杂,如果按矩阵元素推导会很麻烦,所以我直接对矩阵求导,但是我尝试写代码的时候才发现了这个无法相乘的问题。
我看到一些文章提到可以利用张量求列向量对矩阵的导数,但没有更进一步的解释了。
如果有描述模糊和不正确的地方,麻烦指正,我会及时修改。谢谢大家了!
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zaq123321

专家顾问 (著名写手)

【答案】应助回帖

感谢参与,应助指数 +1
引用回帖:
3楼: Originally posted by pluiefox at 2015-11-04 09:45:10
J 是  的二范数的平方再乘以二分之一,为了简化问题可以把 J 重新定义为:
J = ||p||,即 J 为 p 的一范数,系数全为1的p的分量的线性组合。
对于改过的式子,我按元素推导,先得到了{∂J / ∂Wij},这 ...

You can write out the squared vector norm as inner product   f=<a, a>=a^Ta.
Here a=(VW-I)(c_1, c_2).
Then df/dW = 2*<a, da/dW>  
You can find how to calculate da/dW from matrix calculus website and get answer.
小木虫给我温暖,给我希望,爱就要爱小木虫。
4楼2015-11-04 10:32:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 4 个回答

zaq123321

专家顾问 (著名写手)

What's the matrix norm in J

[ 发自手机版 http://muchong.com/3g ]
小木虫给我温暖,给我希望,爱就要爱小木虫。
2楼2015-11-04 00:09:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

pluiefox

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by zaq123321 at 2015-11-04 00:09:04
What's the matrix norm in J

J 是 [p - [c1 ; c2]] 的二范数的平方再乘以二分之一,为了简化问题可以把 J 重新定义为:
J = ||p||,即 J 为 p 的一范数,系数全为1的p的分量的线性组合。
对于改过的式子,我按元素推导,先得到了{∂J / ∂Wij},这个结果可以认为是正确的。接着我按矩阵向量推导(不考虑矩阵求导规则),结果是:
{∂J / ∂Wij} = ((J/p) * (p/q)) * (q/W)) = [1, 1, ... , 1] * V * [c1;c2]
其中 J/p 表示 J 对 p 求偏导,其余一样。
并且偏导数 J/p 和 p/q 用的分子布局,所以 J/p 是 2n 维行向量,p/q 是2n x n 矩阵,而 q/W 暂时不考虑正确性和布局形式直接用 [c1;c2] 表示。
然后由于维度不同不构成乘法项,我把上面结果改成:
((J/p) * (p/q))' * c'
'表示取转置。然后这样的结果就和我按元素推导的结果相同了。我想知道这样的做法对不对?因为虽然结果正确了,但是我在这里还是用了不适用的链式法则,而且还以满足乘法规则为目的对结果取转置,这种做法可能只是答案正确而且很偶然。
3楼2015-11-04 09:45:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 生物学一志愿985,分数349求调剂 +6 zxts12 2026-03-21 9/450 2026-03-23 18:37 by macy2011
[考研] 341求调剂(一志愿湖南大学070300) +3 番茄头--- 2026-03-22 4/200 2026-03-23 18:35 by macy2011
[考研] 328求调剂 +4 LHHL66 2026-03-23 4/200 2026-03-23 14:55 by lbsjt
[考研] 306求调剂 +9 chuanzhu川烛 2026-03-18 9/450 2026-03-23 13:17 by luoyongfeng
[考研] 263求调剂 +6 yqdszhdap- 2026-03-22 9/450 2026-03-23 12:57 by yqdszhdap-
[考研] 求老师收我 +3 zzh16938784 2026-03-23 3/150 2026-03-23 12:56 by ztnimte
[考研] 环境学硕288求调剂 +6 皮皮皮123456 2026-03-22 6/300 2026-03-22 16:52 by i_cooler
[考研] 289求调剂 +7 怀瑾握瑜l 2026-03-20 7/350 2026-03-22 15:57 by ColorlessPI
[考研] 319求调剂 +4 小力气珂珂 2026-03-20 4/200 2026-03-22 15:53 by ColorlessPI
[考研] 求调剂院校信息 +6 CX 330 2026-03-21 6/300 2026-03-22 15:25 by 无懈可击111
[考研] 269专硕求调剂 +6 金恩贝 2026-03-21 6/300 2026-03-22 14:31 by ColorlessPI
[考研] 材料学硕301分求调剂 +7 Liyouyumairs 2026-03-21 7/350 2026-03-21 22:31 by peike
[考研] 材料工程专硕 348分求调剂 +3 冬辞. 2026-03-17 5/250 2026-03-21 18:47 by 学员8dgXkO
[考研] 【考研调剂】化学专业 281分,一志愿四川大学,诚心求调剂 +11 吃吃吃才有意义 2026-03-19 11/550 2026-03-21 18:23 by 学员8dgXkO
[考研] 303求调剂 +5 睿08 2026-03-17 7/350 2026-03-21 03:11 by JourneyLucky
[考研] 初始318分求调剂(有工作经验) +3 1911236844 2026-03-17 3/150 2026-03-21 02:33 by JourneyLucky
[考研] 求调剂 +3 Ma_xt 2026-03-17 3/150 2026-03-21 02:05 by JourneyLucky
[考研] 材料学硕297已过四六级求调剂推荐 +11 adaie 2026-03-19 11/550 2026-03-20 21:30 by laoshidan
[考研] 一志愿西南交通 专硕 材料355 本科双非 求调剂 +5 西南交通专材355 2026-03-19 5/250 2026-03-20 21:10 by JourneyLucky
[考研] 广西大学家禽遗传育种课题组2026年硕士招生(接收计算机专业调剂) +3 123阿标 2026-03-17 3/150 2026-03-20 15:58 by 飞行琦
信息提示
请填处理意见