PyTorch 使用 TensorBoard 可视化模型，数据和训练

在深度学习模型的训练过程中，可视化是一个不可或缺的环节。它可以帮助我们更好地理解模型的行为、数据的分布以及训练过程的进展。PyTorch 与 TensorBoard 的深度集成，为我们提供了强大的可视化工具。本教程将指导你如何使用 PyTorch 和 TensorBoard 进行模型训练的可视化，助力你在深度学习的道路上事半功倍。

一、环境准备

在开始之前，确保你已经安装了以下必要的库：

import matplotlib.pyplot as plt
import numpy as np
import torch
import torchvision
import torchvision.transforms as transforms
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.tensorboard import SummaryWriter

二、数据加载与预处理

我们将使用 Fashion-MNIST 数据集，这是一个广泛用于分类任务的数据集，包含 10 个类别的服装图像。

## 定义数据转换
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])


## 加载数据集
trainset = torchvision.datasets.FashionMNIST('./data', download=True, train=True, transform=transform)
testset = torchvision.datasets.FashionMNIST('./data', download=True, train=False, transform=transform)


## 创建数据加载器
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2)
testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2)


## 定义类别名称
classes = ('T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle Boot')

三、定义模型架构

我们定义一个简单的卷积神经网络，用于 Fashion-MNIST 数据集的分类任务。

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 6, 5)  # 输入通道1，输出通道6，卷积核大小5
        self.pool = nn.MaxPool2d(2, 2)   # 最大池化层，窗口大小2，步长2
        self.conv2 = nn.Conv2d(6, 16, 5) # 输入通道6，输出通道16，卷积核大小5
        self.fc1 = nn.Linear(16 * 4 * 4, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)


    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))  # 卷积 + 激活 + 池化
        x = self.pool(F.relu(self.conv2(x)))  # 卷积 + 激活 + 池化
        x = x.view(-1, 16 * 4 * 4)            # 展平操作
        x = F.relu(self.fc1(x))               # 全连接 + 激活
        x = F.relu(self.fc2(x))               # 全连接 + 激活
        x = self.fc3(x)                       # 输出层
        return x


net = Net()
print(net)

四、设置 TensorBoard

创建一个 SummaryWriter 对象，用于将信息写入 TensorBoard。

## 设置 TensorBoard
writer = SummaryWriter('runs/fashion_mnist_experiment')

五、写入数据到 TensorBoard

将训练数据和模型结构写入 TensorBoard，以便进行可视化。

## 获取一批训练数据
dataiter = iter(trainloader)
images, labels = next(dataiter)


## 创建图像网格
img_grid = torchvision.utils.make_grid(images)


## 将图像写入 TensorBoard
writer.add_image('Fashion-MNIST_images', img_grid)


## 将模型结构写入 TensorBoard
writer.add_graph(net, images)


## 关闭 TensorBoard writer
writer.close()

六、训练模型并跟踪训练过程

在训练过程中，我们将损失值和模型预测结果写入 TensorBoard，以便实时跟踪训练进度。

## 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)


## 训练模型
running_loss = 0.0
for epoch in range(2):  # 遍历数据集多次
    for i, data in enumerate(trainloader, 0):
        # 获取输入数据和标签
        inputs, labels = data


        # 清空梯度缓存
        optimizer.zero_grad()


        # 前向传播 + 反向传播 + 优化
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()


        # 累计损失
        running_loss += loss.item()


        # 每 1000 个批次写入 TensorBoard
        if i % 1000 == 999:
            writer.add_scalar('training_loss', running_loss / 1000, epoch * len(trainloader) + i)
            running_loss = 0.0


print('Finished Training')

七、评估模型并生成可视化报告

在测试集上评估模型性能，并生成精度召回曲线等可视化报告。

## 在测试集上评估模型
class_probs = []
class_preds = []
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        probs = torch.softmax(outputs, dim=1)
        _, preds = torch.max(outputs, 1)
        class_probs.append(probs)
        class_preds.append(preds)


test_probs = torch.cat(class_probs)
test_preds = torch.cat(class_preds)


## 为每个类别生成精度召回曲线
for i in range(len(classes)):
    writer.add_pr_curve(classes[i], test_preds == i, test_probs[:, i])


## 关闭 TensorBoard writer
writer.close()

八、总结

通过本教程，你已经掌握了如何使用 PyTorch 和 TensorBoard 进行深度学习模型的可视化。 TensorBoard 提供了丰富的可视化工具，可以帮助你更好地理解模型的行为和训练过程。希望你在编程狮的学习平台上能够充分利用这些工具，提升你的深度学习项目开发能力！

在编程狮平台学习的你，现在可以尝试以下实践项目来加深对 TensorBoard 可视化的理解：

可视化自定义数据集 ：使用你在编程狮平台上学习到的自定义数据集知识，结合 TensorBoard 的可视化功能，展示不同数据增强方法对图像数据的影响。例如，对比原始图像与经过旋转、裁剪、翻转等变换后的图像，观察这些变换如何提高模型的泛化能力。
跟踪模型性能指标 ：在训练一个更复杂的模型（如用于图像分割或自然语言处理的模型）时，使用 TensorBoard 记录多个性能指标，如准确率、召回率、F1 值等。分析这些指标在训练过程中的变化趋势，找出模型优化的方向。

w3cschool 编程狮，随时随地学编程

PyTorch 使用 TensorBoard 可视化模型，数据和训练

一、环境准备

二、数据加载与预处理

三、定义模型架构

四、设置 TensorBoard

五、写入数据到 TensorBoard

六、训练模型并跟踪训练过程

七、评估模型并生成可视化报告

八、总结

PyTorch 入门

PyTorch 入门教程：60 分钟掌握深度学习基础

PyTorch 图片

Pytorch 音频

Pytorch 文本

PyTorch 命名为 Tensor(实验性）

PyTorch 强化学习

PyTorch 在生产中部署 PyTorch 模型

PyTorch 并行和分布式训练

PyTorch 扩展

PyTorch 模型优化

PyTorch 用其他语言

PyTorch 基础知识

PyTorch 笔记

PyTorch 语言绑定

Python API

PyTorch torchvision参考

PyTorch 音频参考

PyTorch 社区