遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Tanh (Hyperbolic Tangent)

学习 Tanh 激活函数如何通过数据零中心化改善神经网络训练。探索其在 RNNs、GANs 和 Ultralytics YOLO26 模型中的角色。

Tanh (双曲正切) 函数是一种数学激活函数,广泛应用于人工神经网络的隐藏层中。它将输入值转换为 -1 到 1 之间的输出范围,形成类似于 sigmoid 函数但以零为中心的 S 形曲线。这种零中心化特性至关重要,因为它通过归一化神经元的输出,确保流经网络的数据平均值更接近零,从而使模型能够更高效地学习。通过显式处理负值,Tanh 能够帮助神经网络捕获数据中更复杂的模式和关系。

Link to this section深度学习中 Tanh 的机制#

In the architecture of deep learning models, activation functions introduce non-linearity, enabling the network to learn complex boundaries between different classes of data. Without functions like Tanh, a neural network would behave like a simple linear regression model, regardless of how many layers it has. The Tanh function is particularly effective in recurrent neural networks (RNN) and certain types of feed-forward networks where maintaining a balanced, zero-centered activation distribution helps prevent the vanishing gradient problem during backpropagation.

当输入映射到 -1 到 1 的范围时,强负输入导致负输出,强正输入导致正输出。这与 Sigmoid 函数不同,后者将值压缩在 0 到 1 之间。由于 Tanh 输出在零附近对称,梯度下降过程通常收敛得更快,因为后续层中的权重不会持续向单一方向移动(这种现象在优化中被称为“之字形”路径)。

Link to this section实际应用#

在特定的架构和用例中,尤其是在需要序列处理和连续值估计的情况下,Tanh 依然发挥着至关重要的作用。

  • 自然语言处理 (NLP): 在诸如长短期记忆 (LSTM) 网络和门控循环单元 (GRU) 等架构中,Tanh 被用作调节信息流的主要激活函数。例如,在机器翻译任务中,模型将文本从英语翻译成法语,Tanh 帮助 LSTM 的内部门决定保留或遗忘多少先前的上下文(记忆)。这使得模型能够处理句子结构中的长期依赖关系。
  • 生成对抗网络 (GAN): 在许多生成对抗网络的生成器组件中,Tanh 经常被用作输出层的最终激活函数。由于图像在预处理过程中通常被归一化到 -1 到 1 的范围,使用 Tanh 可以确保生成器产生处于相同有效范围内的像素值。这种技术有助于为文生图生成等应用合成逼真的图像。

Link to this section对比:Tanh vs. Sigmoid vs. ReLU#

区分 Tanh 与其他常见函数有助于了解何时使用它。

  • Tanh vs. Sigmoid 两者都是 S 形曲线。然而,Sigmoid 输出 0 到 1 之间的值,这可能导致梯度比 Tanh 更快消失。Sigmoid 通常保留用于二元分类问题的最终输出层(概率预测),而 Tanh 更受 RNN 隐藏层的青睐。
  • Tanh vs. ReLU (修正线性单元) 在诸如 YOLO26 等现代卷积神经网络 (CNN) 中,对于隐藏层,ReLU 及其变体(如 SiLU)通常比 Tanh 更受欢迎。这是因为 ReLU 能更有效地避免极深网络的梯度消失问题,且计算成本更低。由于涉及指数运算,Tanh 的计算开销更大。

Link to this section在 PyTorch 中实现激活函数#

虽然像 YOLO26 这样的高级模型会在其配置文件内部处理激活定义,但了解如何使用 PyTorch 应用 Tanh 对于构建自定义模型非常有用。

import torch
import torch.nn as nn

# Define a sample input tensor with positive and negative values
input_data = torch.tensor([-2.0, -0.5, 0.0, 0.5, 2.0])

# Initialize the Tanh activation function
tanh = nn.Tanh()

# Apply Tanh to the input data
output = tanh(input_data)

# Print results to see values squashed between -1 and 1
print(f"Input: {input_data}")
print(f"Output: {output}")

对于有兴趣训练自定义架构或有效管理数据集的用户,Ultralytics Platform 提供了一个简化的环境,可以尝试不同的模型超参数,可视化训练指标,并部署解决方案,而无需手动编写神经网络的每一层代码。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅