2.2 手写数字分类
手写数字分类 (MNIST) 是一个经典的深度学习入门任务!
创建日期: 2022-04-12
2.3.1 数据集
处理数据样本的代码可能会变得混乱和难以维护;理想情况下,我们希望将数据集代码与模型训练代码分离,以提高可读性和模块化。PyTorch 提供两个基础数据接口:torch.utils.data.DataLoader
和 torch.utils.data.Dataset
,允许我们使用预加载的数据集以及自己的数据集。Dataset
存醋样本和它们对应的标签,DataLoader
使用可迭代的对象包装 Dataset
,以便可以轻松地访问样本。
PyTorch 提供了很多预加载的数据集,比如 (MNIST) ,它们可用于对模型进行原型设计和基准测试。
2.3.1.1 加载数据集
以下是如何从 TorchVision 中加载 MNIST 数据集的示例。MNIST 数据集包含 60,000 个训练样本和 10,000 个测试样本。每个样本包含一张 28×28 的灰度图像以及一个来自 10 个类别之一的相关标签。