6.3 语言模型数据集

发布于 2025-02-18

读取数据集 首先读取这个数据集 这个数据集有6万多个字符。把换行符替换成空格,然后仅使用前1万个字符来训练模型。 建立字符索引 将 …


6.2 循环神经网络

发布于 2025-02-18

不含隐藏状态的神经网络 考虑一个含单隐藏层的多层感知机。给定样本数为$n$、输入个数(特征数或特征向量维度)为$d$的小批量数据样 …


6.1 语言模型

发布于 2025-02-18

把一段自然语言文本看作一段离散的时间序列。假设一段长度为$T$的文本中的词依次为$w_1, w_2, \ldots, w_T$,那 …


5.2 填充和步幅

发布于 2025-02-17

假设输入形状是$n_h\times n_w$,卷积核窗口形状是$k_h\times k_w$,那么输出形状将会是 $$(n_h-k …


5.1 二维卷积层

发布于 2025-02-17

卷积神经网络(convolutional neural network)是含有卷积层(convolutional layer)的神 …


4.6 GPU计算

发布于 2025-02-17

计算设备 PyTorch可以指定用来存储和计算的设备,如使用内存的CPU或者使用显存的GPU。默认情况下,PyTorch会将数据创 …


4.5 读取和存储

发布于 2025-02-17

读写Tensor 可以直接使用save函数和load函数分别存储和读取Tensor。save使用Python的pickle实用程序 …


4.4 自定义层

发布于 2025-02-17

不含模型参数的自定义层 先介绍如何定义一个不含模型参数的自定义层。事实上,这和4.1节(模型构造)中介绍的使用Module类构造模 …