1.1 程序安装

安装 CUDA 以及 PyTorch 相关库!

创建日期: 2025-03-08

主要包括 CUDA 和 PyTorch 相关库的安装以及验证。对于新手来说,可以先跳过 GPU 安装部分,用 PyTorch 的 CPU 版本进行学习(后续需要再安装 GPU )。安装指令如下:

pip3 install torch torchvision torchaudio

1.1.1 CUDA 安装

NVIDIA® CUDA® 工具包 提供了一个用于创建高性能 GPU 加速应用的开发环境。借助它,我们可以加速在嵌入式系统、桌面工作站、企业数据中心、基于云的平台和超级计算机上开发、优化和部署应用程序。该工具包包括 GPU 加速库、调试和优化工具、C/C++ 编译器和运行时库。

英伟达 CUDA 下载地址:https://developer.nvidia.com/cuda-downloads

CUDA 下载页面提供诸多选项,如下所示:

Windows 用户按照流程操作完成之后,在终端输入 nvidia-smi 指令:

显示 CUDA 为 12.8 版本,内存大约为 8 GB 。也可以输入 nvcc --version 查看编译工具的情况:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Fri_Feb_21_20:42:46_Pacific_Standard_Time_2025
Cuda compilation tools, release 12.8, V12.8.93
Build cuda_12.8.r12.8/compiler.35583870_0

1.1.2 nbody 运行

在 CUDA 的 快速预览 中会运行一个 nbody 程序,如下所示:

nbody

注:N-body 问题描述的是在一个系统中有 N 个粒子相互作用,并且在一定时间内计算这些粒子的运动。每个粒子之间的相互引力会影响其他粒子的运动轨迹,通常通过牛顿引力定律来描述。

主要操作步骤如下:

  1. 下载 cuda-samples 源代码,进入 Samples/5_Domain_Specific/nbody/ 目录;

  2. Windows 用户需要 freeglut.dllglew64.dll 两个库,freeglut.dll 需要下载源码,使用 Visual Studio 进行编译;

  3. 使用代码编辑器打开 nbody 工程,点击运行。

终端输出提示:

> Windowed mode
> Simulation data stored in video memory
> Single precision floating point simulation
> 1 Devices used for simulation
GPU Device 0: "Ada" with compute capability 8.9

> Compute 8.9 CUDA device: [NVIDIA GeForce RTX 4070 Laptop GPU]

1.1.3 安装 PyTorch

进入 官方页面 ,安装带有 CUDA 版本的 torch 程序:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

执行完成之后,可以进入 Python 解释器,输入:

import torch

print(torch.__version__)

本教程当前使用的版本是 2.6.0+cu124 ,版本有点出入不影响学习。

1.1.4 确认

为了确保 PyTorch 已正确安装,我们可以通过代码来验证安装。文件 install_verify.py 构建一个随机初始化的张量:

import torch

x = torch.rand(5, 3)
print(x)

输出类似于以下内容:

tensor([[0.6853, 0.2405, 0.5365],
    [0.8243, 0.7536, 0.9059],
    [0.2503, 0.2276, 0.4458],
    [0.4820, 0.8708, 0.9114],
    [0.7133, 0.1347, 0.5230]])

此外,需要检查 GPU 驱动程序和 CUDA 是否已启用并可供 PyTorch 访问,运行以下命令来返回 CUDA 驱动程序是否已启用:

print(torch.cuda.is_available())