发布于 2025-02-24 6.4 循环神经网络的从零开始实现 626 热度 NOTHING 深度学习 读取周杰伦专辑歌词数据集: one-hot向量 假设词典中不同字符的数量为$N$(即词典大小vocab_size),每个字符已经同 …
发布于 2025-02-18 6.3 语言模型数据集 557 热度 NOTHING 深度学习 读取数据集 首先读取这个数据集 这个数据集有6万多个字符。把换行符替换成空格,然后仅使用前1万个字符来训练模型。 建立字符索引 将 …
发布于 2025-02-18 6.2 循环神经网络 597 热度 NOTHING 深度学习 不含隐藏状态的神经网络 考虑一个含单隐藏层的多层感知机。给定样本数为$n$、输入个数(特征数或特征向量维度)为$d$的小批量数据样 …
发布于 2025-02-18 6.1 语言模型 507 热度 NOTHING 深度学习 把一段自然语言文本看作一段离散的时间序列。假设一段长度为$T$的文本中的词依次为$w_1, w_2, \ldots, w_T$,那 …
发布于 2025-02-17 5.2 填充和步幅 465 热度 NOTHING 深度学习 假设输入形状是$n_h\times n_w$,卷积核窗口形状是$k_h\times k_w$,那么输出形状将会是 $$(n_h-k …
发布于 2025-02-17 5.1 二维卷积层 431 热度 NOTHING 深度学习 卷积神经网络(convolutional neural network)是含有卷积层(convolutional layer)的神 …
发布于 2025-02-17 4.6 GPU计算 381 热度 NOTHING 深度学习 计算设备 PyTorch可以指定用来存储和计算的设备,如使用内存的CPU或者使用显存的GPU。默认情况下,PyTorch会将数据创 …
发布于 2025-02-17 4.5 读取和存储 362 热度 NOTHING 深度学习 读写Tensor 可以直接使用save函数和load函数分别存储和读取Tensor。save使用Python的pickle实用程序 …
发布于 2025-02-17 4.4 自定义层 338 热度 NOTHING 深度学习 不含模型参数的自定义层 先介绍如何定义一个不含模型参数的自定义层。事实上,这和4.1节(模型构造)中介绍的使用Module类构造模 …
发布于 2025-02-17 4.2 模型参数的访问、初始化和共享 357 热度 NOTHING 深度学习 导入需要的库,init模块包含了多种模型初始化方法。定义一个含单隐藏层的多层感知机。 输出: 访问模型参数 对于Sequentia …