Ultralytics YOLO26: O novo padrão para Vision AI focado na edge
Aprende como o Ultralytics YOLO26 estabelece um novo padrão para Vision AI focado na edge com inferência end-to-end sem NMS, desempenho de CPU mais rápido e implementação em produção simplificada.

Hoje, a Ultralytics lança oficialmente o YOLO26, o modelo YOLO mais avançado e implantável até hoje. Anunciado pela primeira vez no YOLO Vision 2025 (YV25), o YOLO26 representa uma mudança fundamental na forma como os modelos de visão computacional são treinados, implantados e escalados em sistemas do mundo real.
A IA de visão está migrando rapidamente para o edge. Cada vez mais, imagens e vídeos são processados diretamente em dispositivos, câmeras, robôs e sistemas embarcados, onde latência, confiabilidade e custo são mais importantes do que a computação bruta em nuvem. O YOLO26 foi projetado para essa realidade, entregando um desempenho líder mundial enquanto roda de forma eficiente em CPUs, aceleradores de edge e hardware de baixo consumo.
Embora o YOLO26 seja um salto significativo, ele ainda mantém a experiência familiar e otimizada do Ultralytics YOLO com a qual os desenvolvedores contam. Ele se encaixa perfeitamente em fluxos de trabalho existentes, suporta uma ampla gama de tarefas de visão e continua fácil de usar, tornando a adoção direta tanto para equipes de pesquisa quanto de produção.

Fig 1. Um exemplo de uso do Ultralytics YOLO26 para detecção de objetos
Neste artigo, detalharemos tudo o que você precisa saber sobre o Ultralytics YOLO26 e o que um modelo YOLO mais leve, menor e mais rápido significa para o futuro da IA de visão. Vamos começar!
Link to this sectionO Ultralytics YOLO26 estabelece um novo padrão para a IA de visão#
O Ultralytics YOLO26 é construído em torno da ideia de que capacidades impactantes de IA de visão devem ser fáceis de acessar para todos. Acreditamos que ferramentas poderosas de visão computacional não devem ser trancadas ou limitadas a um pequeno grupo de organizações.
No YV25 em Londres, nosso Fundador & CEO Glenn Jocher compartilhou suas ideias sobre essa visão, dizendo: “A tecnologia de IA mais incrível está a portas fechadas. Não é aberta. Grandes empresas controlam novos desenvolvimentos, e todos os outros têm que esperar na fila por acesso. Temos uma visão diferente na Ultralytics. Queremos que a IA esteja nas mãos de todos.”
Ele também explicou que isso significa tirar a IA da nuvem e trazê-la para ambientes do mundo real, acrescentando: “Queremos que a tecnologia não apenas fique na nuvem, mas que seja trazida para dispositivos de edge, para seu telefone, seus veículos e sistemas de baixo consumo. E queremos que essas pessoas incríveis que estão criando soluções tenham acesso a isso.”
O YOLO26 reflete essa visão na prática: um modelo projetado para rodar onde a IA de visão é realmente implantada, não onde é mais fácil prototipar.
Link to this sectionAnalisando o Ultralytics YOLO26: Um modelo de visão de última geração#
Como modelos anteriores do Ultralytics YOLO, o YOLO26 suporta várias tarefas de visão computacional dentro de uma única família de modelos unificada. Ele está disponível em cinco tamanhos, Nano (n), Small (s), Medium (m), Large (l) e Extra Large (x), permitindo que as equipes equilibrem velocidade, precisão e tamanho do modelo dependendo das restrições de implantação.
Além da flexibilidade, o YOLO26 eleva a barra de desempenho. Em comparação ao YOLO11, o modelo nano do YOLO26 entrega uma inferência em CPU até 43% mais rápida, tornando-o um dos modelos de detecção de objetos de alta precisão mais rápidos disponíveis para implantação em edge e baseada em CPU.

Fig 2. O Ultralytics YOLO26 é um modelo de visão de última geração.
Aqui está um olhar mais atento sobre as tarefas de visão computacional suportadas pelo YOLO26:
- Classificação de imagens: O YOLO26 pode analisar uma imagem inteira e atribuí-la a uma categoria específica, ajudando sistemas a entender o contexto geral de uma cena.
- Detecção de objetos: O modelo pode encontrar e localizar múltiplos objetos em imagens ou vídeos.
- Segmentação de instâncias: O YOLO26 pode contornar objetos individuais com detalhes em nível de pixel.
- Estimativa de pose: Ele pode ser usado para identificar pontos-chave e estimar poses para pessoas e outros objetos.
- Detecção de caixa delimitadora orientada (OBB): O YOLO26 pode detectar objetos em diferentes ângulos, o que é especialmente útil para imagens aéreas e de satélite.
- Rastreamento de objetos: Em combinação com o pacote Python da Ultralytics, o YOLO26 pode ser usado para seguir objetos através de quadros de vídeo e transmissões ao vivo.
Todas as tarefas suportam treinamento, validação, inferência e exportação dentro de um framework consistente.
Link to this sectionPrincipais inovações por trás do Ultralytics YOLO26#
O Ultralytics YOLO26 introduz várias inovações fundamentais que melhoram a velocidade de inferência, a estabilidade de treinamento e a simplicidade de implantação. Aqui está uma visão geral dessas inovações:
- Remoção da Distribution Focal Loss (DFL): O módulo DFL foi removido para simplificar a previsão da caixa delimitadora, melhorar a compatibilidade de hardware e tornar os modelos mais fáceis de exportar e executar em dispositivos de edge e de baixo consumo.
- Inferência end-to-end sem NMS: O YOLO26 é projetado como um modelo nativo end-to-end que fornece previsões finais diretamente, eliminando a necessidade de Non-Maximum Suppression e reduzindo a latência de inferência e a complexidade de implantação.
- Progressive Loss Balancing + STAL: Estas estratégias de perda aprimoradas estabilizam o treinamento e melhoram a precisão da detecção, particularmente para objetos pequenos e difíceis de detectar.
- Otimizador MuSGD: O YOLO26 usa um novo otimizador híbrido que mistura SGD com técnicas de otimização inspiradas em Muon para um treinamento mais estável.
- Inferência em CPU até 43% mais rápida: Especificamente otimizado para computação de edge, o YOLO26 entrega uma inferência em CPU até 43% mais rápida, permitindo desempenho em tempo real em dispositivos de edge.
Em seguida, vamos percorrer esses recursos de próxima geração que tornam o YOLO26 mais rápido, mais eficiente e mais fácil de implantar em detalhes.
Link to this sectionSimplificando a previsão através da remoção da Distribution Focal Loss#
Modelos YOLO anteriores usavam Distribution Focal Loss (DFL) durante o treinamento para melhorar a precisão da caixa delimitadora. Embora eficaz, a DFL introduzia complexidade adicional e impunha limites de regressão fixos que tornavam a exportação e a implantação mais desafiadoras, particularmente em hardware de edge e de baixo consumo.
O YOLO26 remove a DFL completamente. Remover a DFL elimina os limites fixos de regressão de caixa delimitadora presentes em modelos anteriores, melhorando a confiabilidade e a precisão ao detectar objetos muito grandes.
Ao simplificar o processo de previsão de caixa delimitadora, o YOLO26 torna-se mais fácil de exportar e roda com maior confiabilidade em uma ampla gama de dispositivos de edge e de baixo consumo.
Link to this sectionInferência end-to-end sem NMS com o Ultralytics YOLO26#
Pipelines tradicionais de detecção de objetos dependem de Non-Maximum Suppression (NMS) como uma etapa de pós-processamento para filtrar previsões sobrepostas. Embora eficaz, o NMS adiciona latência, complexidade e fragilidade, especialmente ao implantar modelos em múltiplos runtimes e alvos de hardware.
O YOLO26 introduz um modo de inferência nativo end-to-end, onde o modelo fornece diretamente as previsões finais sem exigir NMS como uma etapa de pós-processamento separada. Previsões duplicadas são tratadas dentro da própria rede.
Eliminar o NMS reduz a latência, simplifica os pipelines de implantação e reduz o risco de erros de integração, tornando o YOLO26 particularmente bem adequado para implantações em tempo real e de edge.
Link to this sectionMelhorando o reconhecimento com Progressive Loss Balancing + STAL#
Um recurso crucial relacionado ao treinamento é a introdução de Progressive Loss Balancing (ProgLoss) e Small-Target-Aware Label Assignment (STAL). Estas funções de perda aprimoradas ajudam a estabilizar o treinamento e melhorar a precisão da detecção.
O ProgLoss ajuda o modelo a aprender de forma mais consistente durante o treinamento, reduzindo a instabilidade e permitindo que ele converja de forma mais suave. Enquanto isso, o STAL foca em melhorar a forma como o modelo aprende com objetos pequenos, que geralmente são mais difíceis de detectar devido ao detalhe visual limitado.
Juntos, o ProgLoss e o STAL levam a detecções mais confiáveis, com melhorias notáveis no reconhecimento de objetos pequenos. Isso é especialmente importante para aplicações de edge, como Internet das Coisas (IoT), robótica e imagens aéreas, onde os objetos são frequentemente pequenos, distantes ou parcialmente visíveis.
Link to this sectionTreinamento mais estável com o otimizador MuSGD#
Com o YOLO26, adotamos um novo otimizador chamado MuSGD, projetado para tornar o treinamento mais estável e eficiente. O MuSGD é uma abordagem híbrida que combina os pontos fortes do Stochastic Gradient Descent (SGD) tradicional com técnicas inspiradas em Muon, um otimizador usado no treinamento de grandes modelos de linguagem (LLM).
O SGD tem sido uma escolha confiável em visão computacional por muito tempo, graças à sua simplicidade e forte generalização. Ao mesmo tempo, avanços recentes no treinamento de LLM mostraram que novos métodos de otimização podem melhorar a estabilidade e a velocidade quando aplicados com cuidado. O MuSGD traz algumas dessas ideias para o espaço da visão computacional.
Inspirado no Kimi K2 da Moonshot AI, o MuSGD incorpora estratégias de otimização que ajudam o modelo a convergir de forma mais suave durante o treinamento. Isso torna possível para o YOLO26 alcançar um forte desempenho mais rapidamente enquanto reduz a instabilidade de treinamento, especialmente em setups de treinamento maiores ou mais complexos.
O MuSGD ajuda o YOLO26 a treinar de forma mais previsível através dos tamanhos de modelo, contribuindo tanto para ganhos de desempenho quanto para estabilidade de treinamento.
Link to this sectionO Ultralytics YOLO26 entrega uma inferência em CPU até 43% mais rápida#
À medida que a IA de visão continua a se mover para mais perto de onde os dados são gerados, um forte desempenho de edge está se tornando cada vez mais crucial. Especificamente otimizado para computação de edge, o YOLO26 entrega uma inferência em CPU até 43% mais rápida, garantindo desempenho em tempo real em dispositivos sem GPUs. Esse aprimoramento permite que sistemas de visão responsivos e confiáveis rodem diretamente em câmeras, robôs e hardware embarcado, onde latência, eficiência e restrições de custo definem o que é possível.
Link to this sectionTarefas de visão computacional aprimoradas suportadas pelo Ultralytics YOLO26#
Além de melhorias arquiteturais que tornam a detecção de objetos mais precisa, o YOLO26 também inclui otimizações específicas de tarefa projetadas para melhorar o desempenho em tarefas de visão computacional. Por exemplo, ele aprimora a segmentação de instâncias, a estimativa de pose e a detecção de caixa delimitadora orientada com atualizações direcionadas que melhoram a precisão e a confiabilidade.
Aqui está uma visão geral dessas otimizações:
- Segmentação de instâncias: O YOLO26 usa perda de segmentação semântica para melhorar como o modelo aprende durante o treinamento, o que leva a máscaras de instância mais precisas e consistentes. Um módulo proto atualizado também permite o uso de informações de múltiplas escalas, para que o modelo lide com objetos de diferentes tamanhos de forma mais eficaz, mesmo em cenas complexas.
- Estimativa de pose: Ao integrar a Residual Log-Likelihood Estimation (RLE), uma técnica que modela a incerteza nas previsões de pontos-chave, e melhorar o processo de decodificação, o YOLO26 entrega pontos-chave mais precisos com melhor desempenho em tempo real.
- Detecção de caixa delimitadora orientada: O YOLO26 introduz uma perda de ângulo especializada que ajuda o modelo a aprender a rotação de objetos com mais precisão, especialmente para objetos em formato quadrado onde a orientação pode ser ambígua. A decodificação de OBB otimizada também reduz saltos repentinos nas previsões de ângulo perto de limites de rotação, resultando em estimativas de orientação mais estáveis e consistentes.

Fig 3. Usando o Ultralytics YOLO26 para segmentação de instâncias.
Link to this sectionUltralytics YOLOE-26: segmentação de vocabulário aberto construída sobre o YOLO26#
A Ultralytics também está apresentando o YOLOE-26, uma nova família de modelos de segmentação de vocabulário aberto construída sobre a arquitetura e as inovações de treinamento do YOLO26.
O YOLOE-26 não é uma nova tarefa ou recurso, mas uma família de modelos especializada que reutiliza a tarefa de segmentação existente, ao mesmo tempo que permite prompts de texto, prompts visuais e inferência sem prompt. Disponível em todos os tamanhos padrão do YOLO, o YOLOE-26 entrega uma precisão mais forte e um desempenho mais confiável no mundo real do que modelos de segmentação de vocabulário aberto anteriores.
Link to this sectionO Ultralytics YOLO26 foi projetado para onde a IA de visão realmente roda#
De câmeras orientadas por visão a robôs movidos por visão computacional e pequenos chips de processamento no edge, a visão computacional e a IA estão sendo implantadas diretamente no dispositivo para inferência em tempo real. O Ultralytics YOLO26 é construído especificamente para esses ambientes, onde baixa latência, eficiência e desempenho confiável são vitais.
Em ação, isso significa que o YOLO26 pode ser facilmente implantado em uma ampla gama de hardwares. Especificamente, através do pacote Python da Ultralytics e sua ampla gama de integrações, os modelos podem ser exportados para formatos otimizados para diferentes plataformas e aceleradores de hardware.
Por exemplo, a exportação para TensorRT permite inferência de alto desempenho em GPUs NVIDIA, enquanto o CoreML suporta implantação nativa em dispositivos Apple, e o OpenVINO otimiza o desempenho em hardware Intel. O YOLO26 também pode ser exportado para rodar em múltiplos aceleradores de edge dedicados, permitindo inferência de alto throughput e eficiência energética em hardware especializado de Edge AI.
Estes são apenas alguns exemplos, com muitas outras integrações suportadas em ambientes de edge e produção. Essa flexibilidade permite que um único modelo YOLO26 rode em diversos alvos de implantação. Isso simplifica os fluxos de trabalho de produção e traz a IA de visão para mais perto do edge.
Link to this sectionRedefinindo casos de uso de visão computacional em todos os setores#
Projetado para implantação no mundo real, o YOLO26 pode ser usado em uma ampla gama de casos de uso de visão computacional em diferentes setores. Aqui estão alguns exemplos de onde ele pode ser aplicado:
-
Robótica: O YOLO26 pode ser usado para tarefas como navegação, detecção de obstáculos e interação com objetos. Essas capacidades suportam operações robóticas seguras e eficazes em ambientes dinâmicos.
-
Manufatura: Em linhas de produção, o YOLO26 pode analisar imagens e vídeos para identificar defeitos, componentes ausentes ou problemas de processo. Processar dados no dispositivo mantém a detecção rápida e reduz a dependência de sistemas em nuvem.
-
Aplicações aéreas e de drones: Quando implantado em drones, o YOLO26 pode processar imagens aéreas durante o voo para inspeção, mapeamento e levantamento. Isso torna possível analisar cenas em tempo real, mesmo em locais remotos.
-
Sistemas embarcados e IoT: Com seu design leve, o YOLO26 pode rodar em hardware embarcado de baixo consumo para processar dados visuais localmente. Casos de uso comuns incluem câmeras inteligentes, sensores conectados e dispositivos de monitoramento automatizado.
-
Cidades inteligentes: Em ambientes urbanos, o YOLO26 pode analisar transmissões de vídeo de câmeras de trânsito e espaços públicos. Isso permite aplicações como monitoramento de tráfego, segurança pública e gestão de infraestrutura no edge.

Fig 4. O YOLO26 pode ser usado para várias aplicações de visão computacional.
Link to this sectionComeçando com o Ultralytics YOLO26#
O Ultralytics YOLO26 pode ser usado através de dois fluxos de trabalho complementares, dependendo de como você constrói e implanta IA de visão.
Opção 1: Use o Ultralytics YOLO26 através da Ultralytics Platform (recomendado)
A Ultralytics Platform fornece uma maneira centralizada de treinar, implantar e monitorar modelos YOLO26 em produção. Ela reúne datasets, experimentos e implantações em um só lugar, tornando mais fácil gerenciar fluxos de trabalho de IA de visão em escala, especialmente para equipes implantando em ambientes de edge e de produção.
Através da Platform, os usuários podem:
- Acessar modelos YOLO26
- Treinar e fazer fine-tuning em datasets personalizados
- Exportar modelos para implantação em edge e produção
- Monitorar experimentos e modelos implantados em um único fluxo de trabalho
👉 Explore o YOLO26 na Ultralytics Platform: platform.ultralytics.com/ultralytics/yolo26
Opção 2: Use o Ultralytics YOLO26 via fluxos de trabalho open-source
O YOLO26 permanece totalmente acessível através do ecossistema open-source da Ultralytics e pode ser usado com fluxos de trabalho baseados em Python existentes para treinamento, inferência e exportação.
Os desenvolvedores podem instalar o pacote Ultralytics, carregar modelos YOLO26 pré-treinados e implantá-los usando ferramentas e formatos familiares como ONNX, TensorRT, CoreML ou OpenVINO.
pip install ultralyticsfrom ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")Para usuários que preferem controle prático ou pipelines personalizados, documentação completa e guias estão disponíveis nos documentos da Ultralytics.
Link to this sectionUltralytics YOLO26: Construído para o que vem a seguir em visão computacional#
O Ultralytics YOLO26 foi projetado para atender às necessidades das soluções de IA de visão de amanhã, onde os modelos terão que ser rápidos, eficientes e fáceis de implantar em hardware real. Ao melhorar o desempenho, simplificar a implantação e expandir o que o modelo pode fazer, o YOLO26 se encaixa naturalmente em uma ampla gama de aplicações do mundo real. O YOLO26 estabelece uma nova base para a forma como a IA de visão é construída, implantada e escalada. Estamos empolgados em ver como a comunidade o utiliza para entregar sistemas de visão computacional no mundo real.
Junte-se à nossa comunidade em crescimento e explore nosso repositório no GitHub para recursos práticos de IA. Para construir com IA visual hoje, explore nossas opções de licenciamento. Saiba como a IA na agricultura está transformando o cultivo e como a IA visual na robótica está moldando o futuro visitando nossas páginas de soluções.






