Last updated 2 years ago
非线性
单调
连续
并不一定要求可导,比如 ReLU 就是连续但不可导,在不可导的点取左导数或右导数即可;
ReLU
sigmoid
梯度消失问题;
求导计算量大(计算 $e^{-x}$);
非对称;