PyTorch 中如何使用 torch.nn.Tanh 激活函数?

推荐答案

在 PyTorch 中,torch.nn.Tanh 是一个常用的激活函数,用于将输入值映射到 [-1, 1] 的范围内。以下是如何在 PyTorch 中使用 torch.nn.Tanh 的示例代码:

-- -------------------- ---- -------
------ -----
------ -------- -- --

- ---- ---- -----
---------- - ---------

- ----------
------------ - -------------- --

- -- ---- ----
------------- - ------------------------

------------ ---------
-------------------
------------- ------ ----- -------
--------------------

本题详细解读

1. torch.nn.Tanh 的作用

torch.nn.Tanh 是双曲正切函数(Hyperbolic Tangent Function),它将输入值映射到 [-1, 1] 的范围内。其数学表达式为:

[ \text{Tanh}(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} ]

Tanh 函数在神经网络中常用于隐藏层的激活函数,因为它能够将输入值压缩到一个有限的范围内,并且具有零中心化的特性,有助于加速收敛。

2. 使用步骤

  1. 导入必要的库:首先需要导入 torchtorch.nn 模块。
  2. 创建 Tanh 层:通过 nn.Tanh() 创建一个 Tanh 激活函数层。
  3. 创建输入张量:可以使用 torch.randn 或其他方法创建一个随机的输入张量。
  4. 应用 Tanh 激活函数:将输入张量传递给 Tanh 层,得到经过 Tanh 激活后的输出张量。

3. 示例代码解析

  • input_tensor = torch.randn(2, 3):创建一个形状为 (2, 3) 的随机张量。
  • output_tensor = tanh_layer(input_tensor):将输入张量传递给 Tanh 层,得到输出张量。输出张量的形状与输入张量相同,但每个元素的值都被映射到了 [-1, 1] 的范围内。

4. 输出结果

运行上述代码后,输出将显示输入张量和经过 Tanh 激活后的输出张量。输出张量的每个元素值都在 [-1, 1] 之间。

通过这种方式,你可以在 PyTorch 中轻松使用 torch.nn.Tanh 激活函数。

纠错
反馈