Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Ring Attention

Explore como a Ring Attention dimensiona Transformers para comprimentos de sequência infinitos. Aprenda como essa técnica aprimora LLMs e Vision Transformers para tarefas de dados massivas.

Ring Attention é uma técnica avançada de machine learning (ML) projetada para escalar a janela de contexto de arquiteturas Transformer para comprimentos de sequência virtualmente infinitos. Ao distribuir o complexo cálculo de atenção por um cluster de GPUs conectadas em uma topologia de anel, ele sobrepõe efetivamente a comunicação com a computação. Esse avanço arquitetônico permite que Large Language Models (LLMs) e Vision Transformers (ViT) processem entradas massivas — como livros inteiros ou horas de vídeo contínuo — que excedem de longe a capacidade de memória de qualquer dispositivo de hardware individual.

Link to this sectionSuperando a barreira da janela de contexto#

Em mecanismos de autoatenção padrão, o consumo de memória escala quadraticamente com o comprimento da sequência de entrada. Isso cria um gargalo severo para modelos de deep learning (DL) que tentam analisar dados de longa duração. Para saber mais sobre como a comunidade de IA lida com isso, você pode explorar o trabalho do Berkeley AI Research sobre modelos de contexto grande.

O Ring Attention resolve esse gargalo quadrático dividindo as consultas (queries), chaves (keys) e valores (values) em blocos menores. Cada GPU na rede distribuída calcula um bloco e então passa as chaves e os valores para o dispositivo vizinho no anel. Essa transferência cíclica continua até que todo o mecanismo de atenção seja calculado. Utilizar ferramentas como o pacote de comunicação distribuída do PyTorch permite que desenvolvedores criem esses sofisticados pipelines de treinamento em múltiplos dispositivos.

Link to this sectionRing Attention vs. Flash Attention#

Embora ambas as técnicas otimizem a memória, elas operam em níveis diferentes. Flash Attention é um algoritmo ciente do hardware que minimiza leituras e gravações de memória dispendiosas dentro do SRAM de uma única GPU. Por outro lado, o Ring Attention é um algoritmo distribuído focado em escalar a computação por várias GPUs. Em fluxos de trabalho de IA generativa de última geração, essas duas técnicas são frequentemente combinadas para atingir tanto a eficiência de hardware localizada quanto a escalabilidade massiva em múltiplos dispositivos, conforme detalhado no artigo de pesquisa original sobre Ring Attention no arXiv.

Link to this sectionAplicações no Mundo Real#

A capacidade de processar milhões de tokens simultaneamente desbloqueia recursos poderosos na IA moderna:

  1. Análise abrangente de documentos e bases de código: O Ring Attention permite que os modelos processem milhões de linhas de código ou bibliotecas jurídicas complexas em um único prompt. Isso melhora drasticamente os sistemas que dependem de Retrieval Augmented Generation (RAG), permitindo que eles sintetizem o contexto sem truncar informações vitais. Esse conceito é fundamental para modelos de contexto massivos, como a arquitetura Gemini do Google.

  2. Compreensão estendida de vídeo: Em visão computacional (CV), o processamento de sequências de vídeo de alta resolução geralmente requer subamostragem agressiva. O Ring Attention permite que os modelos analisem feeds de vídeo não compactados de horas de duração. Isso aprimora o reconhecimento de ações e o rastreamento de objetos contínuo em sistemas de segurança e direção autônoma, mantendo a consciência temporal ao longo de longas durações.

Link to this sectionProcessando sequências de visão#

Embora modelos de atenção distribuída massivos lidem com contextos infinitos, aplicações práticas focadas na borda (edge-first) exigem arquiteturas altamente otimizadas. Para inferência em tempo real e processamento de sequências visuais, o Ultralytics YOLO26 oferece desempenho líder do setor sem a carga computacional extrema dos transformers baseados puramente em atenção.

from ultralytics import YOLO

# Load the recommended YOLO26 model for high-speed object tracking
model = YOLO("yolo26n.pt")

# Perform robust multi-object tracking on a long video sequence
results = model.track(source="long_surveillance_feed.mp4", stream=True)

# Iterate through the stream to process temporal tracking data
for frame_result in results:
    print(f"Tracked {len(frame_result.boxes)} objects in current frame.")

Ao construir e escalar essas soluções complexas de detecção de objetos e segmentação de imagem, gerenciar a orquestração de hardware é crítico. A Ultralytics Platform simplifica todo esse processo, oferecendo ferramentas para treinamento em nuvem contínuo, anotação automatizada de datasets e implantação de modelos com um clique em diversos ambientes de hardware. Aproveitar essas plataformas garante que técnicas de escalonamento de ponta façam a transição suave da pesquisa para pipelines de IA escaláveis e prontos para produção.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática