Glossário

Tanh (Tangente Hiperbólica)

Descubra o poder da função de ativação Tanh em redes neurais. Aprenda como ela permite que a IA modele dados complexos com eficiência de centralização em zero!

Tanh (Tangente Hiperbólica) é uma função de ativação amplamente utilizada em redes neurais. É uma função matemática que comprime os valores de entrada em um intervalo entre -1 e 1. Visualmente, produz uma curva em forma de "S", semelhante à função Sigmoid. Sua principal característica é que sua saída é centrada em zero, o que significa que as entradas negativas são mapeadas para saídas negativas e as entradas positivas são mapeadas para saídas positivas. Essa propriedade pode ajudar a acelerar a convergência de algoritmos de otimização como descida do gradiente durante o processo de treinamento do modelo.

Como Funciona a Tanh

Em um modelo de aprendizado profundo, uma função de ativação decide se um neurônio deve ser ativado ou não, calculando uma soma ponderada e adicionando ainda mais um bias a ela. A função Tanh pega qualquer número de valor real e o mapeia para o intervalo [-1, 1]. Grandes valores positivos são mapeados perto de 1, grandes valores negativos são mapeados perto de -1, e valores próximos de zero são mapeados para valores em torno de zero. Esta natureza centrada em zero é uma vantagem significativa, pois ajuda a evitar que as saídas das camadas se desloquem muito em uma direção, o que pode tornar o treinamento mais estável. Para uma explicação técnica detalhada, recursos de instituições como Stanford oferecem notas de curso detalhadas sobre funções de ativação.

Comparação com Outras Funções de Ativação

A Tanh é frequentemente comparada com outras funções de ativação, cada uma com seus próprios pontos fortes e fracos:

Tanh vs. Sigmoid: Ambas as funções têm uma forma S semelhante. No entanto, a função Sigmoid produz valores no intervalo, enquanto Tanh produz valores em [-1, 1]. Como a saída de Tanh é centrada em zero, é frequentemente preferível a Sigmoid nas camadas ocultas de uma rede, pois tende a levar a uma convergência mais rápida.
Tanh vs. ReLU: ReLU e suas variantes, como Leaky ReLU e SiLU, tornaram-se a escolha padrão em muitas arquiteturas modernas de visão computacional. Ao contrário de Tanh, ReLU não é computacionalmente caro e ajuda a mitigar o problema do desaparecimento do gradiente, onde os gradientes tornam-se extremamente pequenos durante a retropropagação. No entanto, Tanh ainda é valioso em contextos específicos onde uma saída limitada é necessária. Você pode ver o uso de funções de ativação modernas em modelos como Ultralytics YOLO11.

Aplicações em IA e Aprendizado de Máquina

Historicamente, Tanh tem sido uma escolha popular, particularmente em:

Redes Neurais Recorrentes (RNNs): Tanh era comumente usado nos estados ocultos de RNNs e variantes como redes de Memória de Longo Prazo (LSTM), especialmente para tarefas em Processamento de Linguagem Natural (NLP). Sua faixa limitada ajuda a regular o fluxo de informações dentro das conexões recorrentes. Veja Entendendo LSTMs para mais detalhes.
Análise de Sentimento: Em modelos de PNL mais antigos, a Tanh ajudava a mapear recursos extraídos do texto (por exemplo, word embeddings processados por uma RNN) para um intervalo contínuo, representando a polaridade do sentimento de negativo (-1) a positivo (+1). Você pode encontrar conjuntos de dados relevantes para análise de sentimento em plataformas como o Kaggle.
Sistemas de Controle e Robótica: Em Aprendizado por Reforço (RL), Tanh é usado às vezes como a função de ativação final para políticas que produzem ações contínuas limitadas dentro de uma faixa específica (por exemplo, controlar o torque do motor entre -1 e +1). Frameworks como o Gymnasium (anteriormente OpenAI Gym) são frequentemente usados em pesquisas de RL.
Camadas Ocultas: Ele pode ser usado nas camadas ocultas de redes feedforward, embora as variantes ReLU sejam agora mais comuns. Ele pode ser escolhido quando a propriedade centrada em zero é particularmente benéfica para o problema ou arquitetura específica. Você pode explorar o desempenho de diferentes arquiteturas em nossas páginas de comparação de modelos.

Embora arquiteturas modernas como o Ultralytics YOLO frequentemente utilizem funções como SiLU para tarefas como detecção de objetos, entender a Tanh permanece valioso. Ela fornece contexto para a evolução das funções de ativação e ainda pode aparecer em designs de rede específicos ou sistemas legados. Frameworks como PyTorch e TensorFlow fornecem implementações padrão de Tanh. Você pode treinar e experimentar diferentes funções de ativação usando plataformas como o Ultralytics HUB. O site Papers with Code também lista pesquisas que utilizam Tanh.

Tanh (Tangente Hiperbólica)

Treine modelos Ultralytics YOLO para otimizar fluxos de trabalho em todos os setores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como Funciona a Tanh

Comparação com Outras Funções de Ativação

Aplicações em IA e Aprendizado de Máquina

Leia mais nesta categoria

Implantar modelos YOLO do Ultralytics usando a integração do ExecuTorch

Principais destaques da Ultralytics na Conferência PyTorch 2025

Utilizar a aprendizagem auto-supervisionada para eliminar o ruído das imagens

Junte-se à comunidade Ultralytics