PyTorch 面试题目录

PyTorch 中 torch.Tensor 的 grad 属性有什么作用？

推荐答案

在 PyTorch 中，torch.Tensor 的 grad 属性用于存储该张量的梯度。当调用 backward() 方法计算梯度时，PyTorch 会自动将计算得到的梯度存储在该张量的 grad 属性中。grad 属性是一个与张量形状相同的张量，包含了每个元素的梯度值。

本题详细解读

1. `grad` 属性的作用

grad 属性是 PyTorch 自动微分机制的一部分。当你对一个张量进行操作并调用 backward() 方法时，PyTorch 会根据计算图自动计算该张量的梯度，并将结果存储在 grad 属性中。这个梯度可以用于优化模型参数，例如在使用梯度下降法时更新权重。

2. `grad` 属性的初始化

在默认情况下，grad 属性是 None，表示尚未计算梯度。只有在调用 backward() 方法后，grad 属性才会被填充为计算得到的梯度值。

3. `grad` 属性的使用场景

模型训练：在训练神经网络时，通常需要计算损失函数对模型参数的梯度，然后使用这些梯度来更新参数。grad 属性存储了这些梯度值。
梯度检查：在调试或验证模型时，可以通过检查 grad 属性来确认梯度是否正确计算。
自定义优化器：如果你需要实现自定义的优化算法，可以直接访问 grad 属性来获取梯度并进行相应的更新操作。

4. 示例代码

-- -------------------- ---- -------
------ -----

- --------- ------------------ -----
- - ------------------ ----- -------------------

- ---------
- - -------

- ----
------------

- ----
-------------  - --- ----------- ----

在这个例子中，x 是一个包含两个元素的张量，y 是 x 中所有元素的和。调用 y.backward() 后，x.grad 将包含 y 对 x 的梯度，即 [1., 1.]。

5. 注意事项

如果 requires_grad 为 False，则 grad 属性将始终为 None。
在多次调用 backward() 时，梯度会累积到 grad 属性中。如果需要清除梯度，可以调用 x.grad.zero_() 或 x.grad = None。

上一篇： PyTorch 中 torch.Tensor 的 requires_grad 属性有什么作用？

下一篇： PyTorch 中 torch.Tensor 的 grad_fn 属性有什么作用？

纠错
反馈