Glossário

Reformer

Descubra o modelo Reformer: uma arquitetura transformer inovadora otimizada para sequências longas com atenção LSH e camadas reversíveis.

O Reformer é uma arquitetura altamente eficiente concebida para melhorar o modelo padrão do modelo padrão do Transformador, reduzindo significativamente o consumo de memória memória e os custos computacionais ao processar sequências muito longas. Enquanto os transformadores tradicionais revolucionaram o Processamento de linguagem natural (PNL), o seu uso de memória aumenta quadraticamente com o comprimento da sequência, tornando-os dispendiosos para serem executados em documentos longos. O Reformer resolve esse gargalo, permitindo o processamento de sequências de até 1 milhão de tokens em uma única GPU (Unidade de Processamento Gráfico), abrindo novas possibilidades para a investigação em Aprendizagem profunda (DL).

Inovações fundamentais por detrás do Reformer

O Reformer introduz duas técnicas principais para atingir uma complexidade linear $O(L)$ em vez de quadrática $O(L^2)$, permitindo-lhe lidar com grandes quantidades de dados de forma mais eficaz do que os seus antecessores.

Agrupamento de dados sensível à localidade (LSH) Atenção: Num mecanismo de atenção padrão, cada cada token atende a todos os outros tokens, o que é computacionalmente pesado. O Reformer usa LSH para agrupar vectores semelhantes semelhantes em grupos. A atenção é então calculada apenas dentro destes grupos, aproximando a matriz de atenção completa com com elevada precisão, mas com uma fração do custo. Isto permite que o modelo se concentre em partes relevantes da entrada sem sem ter de percorrer toda a sequência.
Camadas residuais reversíveis: O treinamento de redes neurais profundas redes neurais profundas normalmente requer o armazenamento activações de cada camada para calcular gradientes durante a retropropagação. O Reformer utiliza camadas reversíveis, que permitem que as activações sejam recalculadas durante a passagem para trás, em vez de serem armazenadas na memória. Esta inovação torna o modelo muito mais eficiente em termos de memória, permitindo o treino de redes muito mais profundas.

Aplicações no Mundo Real

A capacidade de processar contextos alargados torna o Reformer distintamente útil para tarefas em que a compreensão da estrutura global dos dados é crucial.

Análise genómica: As sequências de ADN são compostas por milhões de pares de bases, onde elementos distantes podem influenciar-se mutuamente. O Reformer pode ingerir estas longas sequências para identificar as funções dos genes ou prever as estruturas das proteínas, uma tarefa que muitas vezes consome demasiada memória para modelos padrão como o BERT.
Sumarização de documentos longos: Nos sectores jurídico e financeiro, os profissionais analisam frequentemente documentos com centenas de páginas. Os modelos baseados no Reformer podem processar livros inteiros ou contratos legais numa numa única passagem para realizar o resumo do texto ou resposta a perguntas, mantendo a coerência em longas distâncias, ao contrário de Redes Neurais Recorrentes (RNNs) que podem ter dificuldades com gradientes que desaparecem.
Geração de imagens de alta resolução: Ao tratar os pixéis como uma sequência, o Reformer pode ser aplicado a tarefas de geração de imagens, criando imagens coerentes imagens coerentes de alta resolução, pixel a pixel, sem ficar sem memória.

Distinção de termos relacionados

É importante distinguir o Reformer de outros modelos de sequência. Embora o Longformer também visa sequências longas, mas utiliza um utiliza um mecanismo de atenção de janela deslizante combinado com atenção global. Em contraste, o Reformer baseia-se no hashing (LSH) para encontrar tokens relevantes de forma dinâmica. Além disso, enquanto o YOLO11 é optimizado para velocidade em visão computacional, o Reformer é optimizado para eficiência de memória na modelação de sequências. No entanto, ambos partilham o objetivo de maximizar o desempenho em hardware.

Implementação de uma inferência eficiente

Embora o Reformer seja uma arquitetura específica, o conceito de inferência eficiente é universal na IA. O seguinte exemplo demonstra como efetuar uma inferência eficiente utilizando ultralytics em um fluxo de vídeo - uma forma de dados sequenciais - onde a otimização da velocidade e da memória é fundamental.

from ultralytics import YOLO

# Load the YOLO11n model, optimized for speed and efficiency
model = YOLO("yolo11n.pt")

# Run inference on a video source (treating frames as a sequence)
# stream=True uses a generator to process frames one by one, saving memory
results = model.predict(source="https://ultralytics.com/images/bus.jpg", stream=True)

for result in results:
    # Process each frame's detection results efficiently
    print(f"Detected {len(result.boxes)} objects in current frame.")

Compreender arquitecturas como o Reformer é essencial para navegar na evolução da IA, uma vez que ultrapassam os limites do que é computacionalmente viável com a Inteligência Artificial (IA). Para mais informações sobre o treinamento eficiente de modelos, explore os GuiasUltralytics .

Reformer

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Inovações fundamentais por detrás do Reformer

Aplicações no Mundo Real

Distinção de termos relacionados

Implementação de uma inferência eficiente

Leia mais nesta categoria

Aprendizagem auto-supervisionada para redução de ruído: uma análise passo a passo

Futuras tendências na deteção de objectos: 7 aspectos fundamentais a ter em conta

Melhorar a reidentificação de veículos com modelos Ultralytics YOLO

Junte-se à comunidade Ultralytics