多层感知机(MLP)

本文写的特别好,去看!

除了输入输出层,它中间可以有多个隐层。

MLP的双要素:仿射变换+激活函数

对于一个隐藏层:

进入:向量X

输出:f (W1X+b1),W1是权重,b1是偏置,f是激活函数等。

为嘛使用激活函数?

a. 不使用激活函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合。

b. 使用激活函数,能够给神经元引入非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以利用到更多的非线性模型中。

1
2
3
4
5
%matplotlib inline
import torch
from d2l import torch as d2l


ReLU函数

激活函数之一

1

sigmoid函数

tanh函数

softmax回归