Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Reformer

Explore a arquitetura Reformer, uma variante eficiente de Transformer para sequências longas. Aprenda como a atenção LSH e as RevNets otimizam a memória para pesquisa em IA.

O Reformer é uma variação eficiente da arquitetura Transformer projetada para processar sequências muito longas de dados que seriam proibitivas computacionalmente para modelos padrão. Introduzido para resolver os gargalos de memória inerentes aos sistemas tradicionais de deep learning, o Reformer reduz a complexidade do mecanismo de atenção de termos quadráticos para logarítmicos lineares. Essa inovação permite que pesquisadores de inteligência artificial treinem modelos em janelas de contexto que abrangem dezenas de milhares de tokens — como livros inteiros, imagens de alta resolução ou longas composições musicais — em uma única GPU.

Link to this sectionInovações principais do Reformer#

O Reformer alcança sua eficiência por meio de duas mudanças arquitetônicas primárias que o distinguem de modelos como BERT ou a série GPT original. Essas técnicas abordam a extensa memória necessária para armazenar ativações durante o treinamento de modelos.

  • Atenção por Hashing Sensível à Localidade (LSH): Em um Transformer padrão, cada elemento em uma sequência foca em todos os outros elementos, criando uma carga computacional massiva. O Reformer usa Hashing Sensível à Localidade para agrupar vetores semelhantes. Em vez de calcular pontuações de atenção para todos os pares, o modelo apenas as calcula para um pequeno subconjunto de vizinhos mais próximos, acelerando significativamente o mecanismo de inferência.
  • Camadas Residuais Reversíveis (RevNets): Redes neurais tradicionais precisam armazenar ativações de cada camada para calcular gradientes durante a backpropagation. O Reformer utiliza redes neurais reversíveis, que permitem que a entrada de uma camada seja recomputada a partir de sua saída durante a passagem reversa. Essa técnica elimina a necessidade de armazenar em cache as ativações intermediárias, liberando memória para tamanhos de lote maiores.

Link to this sectionReformer vs. Transformer Padrão#

Embora ambas as arquiteturas dependam do mecanismo de autoatenção, elas servem a propósitos diferentes dentro do ecossistema de machine learning.

  • Transformer Padrão: Excelente para sequências de comprimento curto a médio. No entanto, seu uso de memória cresce quadraticamente ($O(L^2)$) com o comprimento da sequência ($L$). É a base de muitos Large Language Models (LLMs) usados para tarefas como análise de sentimento ou chatbots.
  • Reformer: Otimizado para comprimentos extremos ($O(L \log L)$). Ele sacrifica uma pequena quantidade de precisão em alguns contextos pela capacidade de lidar com entradas que são impossíveis para Transformers padrão, como o processamento de dados extremamente longos de análise de séries temporais ou a geração de imagens pixel por pixel.

Link to this sectionAplicações no Mundo Real#

A capacidade do Reformer de lidar com janelas de contexto vastas abre novas possibilidades em campos onde os dados não podem ser facilmente fragmentados.

  1. Análise Genômica: Sequências de DNA consistem em milhões de pares de bases. O Reformer pode analisar essas longas cadeias para identificar padrões em bioinformática sem perder o contexto mais amplo, auxiliando na previsão da estrutura de proteínas.

  2. Geração de Texto Longo: Ao contrário de modelos padrão de geração de texto que podem perder a coerência após alguns parágrafos, um Reformer consegue manter a consistência ao longo de milhares de palavras, tornando-o adequado para gerar resumos de longos contratos jurídicos ou capítulos inteiros de romances.

Link to this sectionEficiência em Visão Computacional#

Embora os Reformers sejam frequentemente associados a texto, o princípio da eficiência é crucial em visão computacional. Assim como o Reformer otimiza os Transformers, modelos modernos de visão como o YOLO26 otimizam Redes Neurais Convolucionais (CNNs) para inferência em tempo real. Compreender as restrições de memória é vital ao implantar modelos em dispositivos de borda via Plataforma Ultralytics, onde os recursos de hardware são limitados.

O código a seguir demonstra como inspecionar a ocupação de memória de um modelo usando PyTorch, um conceito central para o desenvolvimento de arquiteturas com uso eficiente de memória, como o Reformer.

import torch
import torch.nn as nn

# Define a simple Transformer layer (Standard, not Reformer optimized)
layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
model = nn.TransformerEncoder(layer, num_layers=6)

# Create a long sequence input (Sequence Length: 2000, Batch: 1, Features: 512)
# Standard Transformers struggle as this length increases.
input_data = torch.rand(2000, 1, 512)

# Check parameter count to understand model complexity
params = sum(p.numel() for p in model.parameters())
print(f"Model Parameters: {params:,}")

# Perform a forward pass
output = model(input_data)
print(f"Output shape: {output.shape}")

Link to this sectionConceitos Relacionados#

  • Atenção Esparsa: Uma categoria mais ampla de técnicas, incluindo LSH, onde o modelo foca apenas em um subconjunto de tokens para economizar processamento.
  • Checkpoint de Gradiente: Uma técnica semelhante às camadas reversíveis usada para trocar tempo de computação por memória durante o treinamento de modelos.
  • Otimização de Modelo: A prática geral de melhorar a eficiência do modelo, que engloba quantização, poda e mudanças arquitetônicas como as encontradas no Reformer.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática