3.12 权重衰减

发布于 2025-02-06

范数 L1范数 L1范数是向量中所有元素绝对值的和。对于一个向量 $ w = [w_1, w_2, …, w_n] $,其L1范数 …


3.10 多层感知机的简洁实现

发布于 2025-02-04

导入需要的库 3.10.1 定义模型 和softmax回归唯一的不同在于,多加了一个全连接层作为隐藏层。它的隐藏单元个数为256, …


3.9 多层感知机的从零开始实现

发布于 2025-02-04

导入需要的库 获取和读取数据 定义模型参数 输入个数为784,输出个数为10。实验中,设超参数隐藏单元个数为256。 定义激活函数 …


3.8 多层感知机

发布于 2025-02-03

隐藏层 多层感知机在单层神经网络的基础上引入了一到多个隐藏层(hidden layer)。隐藏层位于输入层和输出层之间。 具体来说 …


3.7 softmax回归的简洁实现

发布于 2025-02-03

导入需要的库 获取和读取数据 定义和初始化模型 softmax回归的输出层是一个全连接层,所以用一个线性模块就可以了。 初始化模型 …


3.6 softmax回归的从零开始实现

发布于 2025-02-02

导入本节实现所需的包或模块 获取和读取数据 先获取Fashion-MNIST数据集,并设置批量大小为256。 使用向量表示每个样本 …


3.4 softmax回归

发布于 2025-01-23

分类问题 线性回归模型适用于输出为连续值的情景。softmax回归适用于离散值的预测问题。 通常使用离散的数值来表示类别,例如$y …


Frpc配置说明

发布于 2025-01-10

项目地址:https://github.com/fatedier/frp 从此处下载对应系统的frpc:https://githu …