4.4 自定义层

发布于 2025-02-17

不含模型参数的自定义层 先介绍如何定义一个不含模型参数的自定义层。事实上,这和4.1节(模型构造)中介绍的使用Module类构造模 …


4.1 模型构造

发布于 2025-02-16

继承Module​类来构造模型 ​Module​类是nn​模块里提供的一个模型构造类,是所有神经网络模块的基类,可以继承它来定义想 …


3.16 实战Kaggle比赛:房价预测

发布于 2025-02-14

获取和读取数据集 比赛数据分为训练数据集和测试数据集。两个数据集的特征值有连续的数字、离散的标签甚至是缺失值“na”。只有训练数据 …


3.15 数值稳定性和模型初始化

发布于 2025-02-14

衰减和爆炸 当神经网络的层数较多时,模型的数值稳定性容易变差。不考虑偏差参数,且设所有隐藏层的激活函数为恒等映射(identity …


3.14 正向传播、反向传播和计算图

发布于 2025-02-11

正向传播 正向传播是指对神经网络沿着从输入层到输出层的顺序,依次计算并存储模型的中间变量(包括输出)。为简单起见,假设输入是一个特 …


3.13 丢弃法

发布于 2025-02-10

方法 除了权重衰减以外,深度学习模型常常使用丢弃法(dropout)来应对过拟合问题。丢弃法有一些不同的变体。本节中提到的丢弃法特 …


3.12 权重衰减

发布于 2025-02-06

范数 L1范数 L1范数是向量中所有元素绝对值的和。对于一个向量 $ w = [w_1, w_2, …, w_n] $,其L1范数 …


3.10 多层感知机的简洁实现

发布于 2025-02-04

导入需要的库 3.10.1 定义模型 和softmax回归唯一的不同在于,多加了一个全连接层作为隐藏层。它的隐藏单元个数为256, …