2.2 手写数字分类

手写数字分类 (MNIST) 是一个经典的深度学习入门任务!

创建日期: 2022-04-12

2.3.1 数据集

处理数据样本的代码可能会变得混乱和难以维护;理想情况下,我们希望将数据集代码与模型训练代码分离,以提高可读性和模块化。PyTorch 提供两个基础数据接口:torch.utils.data.DataLoadertorch.utils.data.Dataset ,允许我们使用预加载的数据集以及自己的数据集。Dataset 存醋样本和它们对应的标签,DataLoader 使用可迭代的对象包装 Dataset ,以便可以轻松地访问样本。

PyTorch 提供了很多预加载的数据集,比如 (MNIST) ,它们可用于对模型进行原型设计和基准测试。

2.3.1.1 加载数据集

以下是如何从 TorchVision 中加载 MNIST 数据集的示例。MNIST 数据集包含 60,000 个训练样本和 10,000 个测试样本。每个样本包含一张 28×28 的灰度图像以及一个来自 10 个类别之一的相关标签。