4-2前向传播和反向传播
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4-2前向传播和反向传播
前向传播和反向传播( Forward and backward propagation)
前向传播
假设输⼊a[l−1],输出a[l],缓存z[l],从实现的⾓度来说缓存w[l],b[l]更容易在不同的环节调⽤函数。
向量化实现过程可以写成:
前向传播需要喂⼊数据A[0]也就是X来初始化。
对于多层神经⽹络,在计算从第1层到第L层时,只能使⽤for循环来实现。
反向传播
输⼊da[l],输出da[l−1],dw[l],db[l]。
所以反向传播的步骤可以写成:
前四个式⼦⽤于实现反向传播,式⼦(5)是由式⼦(4)带⼊到式⼦(1)中得到的。
向量化的实现:
举个例⼦:
上⾯的神经⽹络,第⼀层、第⼆层都是Relu激活函数,最后输出层是sigmoid函数。
前向传播,输⼊X,通过三个激活函数最终输出ˆy,并从⽽计算损失函数:L(ˆy,y)。
反向传播,依次计算dw[3],db[3],dw[2],db[2],dw[1],db[1],在计算的过程中,缓存会把z[1]z[2]z[3]传递过来,然后回传da[2],da[1]。
Processing math: 100%。