3.12 权重衰减
发布于 2025-02-06
范数 L1范数 L1范数是向量中所有元素绝对值的和。对于一个向量 $ w = [w_1, w_2, …, w_n] $,其L1范数 …
训练误差和泛化误差 训练误差(training error)指模型在训练数据集上表现出的误差,泛化误差(generalizatio …
导入需要的库 获取和读取数据 定义和初始化模型 softmax回归的输出层是一个全连接层,所以用一个线性模块就可以了。 初始化模型 …
导入本节实现所需的包或模块 获取和读取数据 先获取Fashion-MNIST数据集,并设置批量大小为256。 使用向量表示每个样本 …
获取数据集 通过torchvision的`torchvision.datasets`来下载这个数据集。第一次调用时会自动从网上获取 …