Comparando o Ultralytics YOLO11 com modelos YOLO anteriores
Compare o Ultralytics YOLOv8, YOLOv9, YOLOv10 e o Ultralytics YOLO11 para entender como esses modelos evoluíram e melhoraram de 2023 a 2025.

Desde a automação de tarefas cotidianas até a ajuda na tomada de decisões informadas em tempo real, a inteligência artificial (IA) está remodelando o futuro de vários setores. Uma área da IA particularmente fascinante é a computer vision, também conhecida como visão computacional. Ela foca em capacitar máquinas a analisar e interpretar dados visuais da mesma forma que os humanos.
Especificamente, modelos de computer vision estão impulsionando inovações que aumentam tanto a segurança quanto a eficiência. Por exemplo, esses modelos são usados em carros autônomos para detectar pedestres e em câmeras de segurança para monitorar locais 24 horas por dia.
Alguns dos modelos de computer vision mais conhecidos são os modelos YOLO (You Only Look Once), conhecidos por suas capacidades de detecção de objetos em tempo real. Com o passar do tempo, os modelos YOLO melhoraram, com cada nova versão oferecendo melhor desempenho e mais flexibilidade.
Versões mais recentes como o Ultralytics YOLO11 conseguem lidar com uma variedade de tarefas, como segmentação de instâncias, classificação de imagens, estimativa de pose e rastreamento de múltiplos objetos, com mais precisão, velocidade e exatidão do que nunca.
Neste artigo, vamos comparar o Ultralytics YOLOv8, YOLOv9, YOLOv10 e Ultralytics YOLO11 para entender melhor como esses modelos evoluíram. Analisaremos seus principais recursos, resultados de benchmarks e diferenças de desempenho. Vamos começar!
Link to this sectionUma visão geral do Ultralytics YOLOv8#
O YOLOv8, lançado pela Ultralytics em 10 de janeiro de 2023, foi um grande passo à frente em comparação aos modelos YOLO anteriores. Ele foi otimizado para detecção precisa e em tempo real, combinando abordagens bem testadas com atualizações inovadoras para obter melhores resultados.
Indo além da object detection, ele também suporta as seguintes tarefas de computer vision: segmentação de instâncias, estimativa de pose, detecção de objetos com caixas delimitadoras orientadas (OBB) e classificação de imagens. Outro recurso importante do YOLOv8 é que ele está disponível em cinco variantes de modelo diferentes - Nano, Small, Medium, Large e X - para que possas escolher o equilíbrio certo entre velocidade e precisão de acordo com as tuas necessidades.
Devido à sua versatilidade e forte desempenho, o YOLOv8 pode ser usado em muitas aplicações do mundo real, como sistemas de segurança, cidades inteligentes, saúde e automação industrial.

Fig 1. Gestão de estacionamento em cidades inteligentes com YOLOv8.
Link to this sectionPrincipais recursos do YOLOv8#
Aqui está uma visão mais detalhada de alguns dos outros recursos principais do YOLOv8:
- Arquitetura de detecção aprimorada: O YOLOv8 usa um backbone CSPDarknet aprimorado. Esse backbone é otimizado para extração de características - o processo de identificar e capturar padrões ou detalhes importantes de imagens de entrada que ajudam o modelo a fazer previsões precisas.
- Detection head: Ele usa um design anchor-free desacoplado, o que significa que não depende de formatos de caixa delimitadora predefinidos (âncoras) e, em vez disso, aprende a prever as localizações dos objetos diretamente. Devido à configuração desacoplada, as tarefas de classificar o que é o objeto e prever onde ele está (regressão) são tratadas separadamente, o que ajuda a melhorar a precisão e a acelerar o treinamento.
- Equilibra precisão e velocidade: Este modelo alcança uma precisão impressionante enquanto mantém tempos de inferência rápidos, tornando-o adequado para ambientes de nuvem e de borda (edge).
- Fácil de usar: O YOLOv8 foi projetado para ser fácil de começar - podes começar a fazer previsões e ver resultados em apenas alguns minutos usando o pacote Python da Ultralytics.
Link to this sectionO YOLOv9 foca na eficiência computacional#
O YOLOv9 foi lançado em 21 de fevereiro de 2024 por Chien-Yao Wang e Hong-Yuan Mark Liao, do Institute of Information Science, Academia Sinica, Taiwan. Ele suporta tarefas como detecção de objetos e instance segmentation.
Este modelo baseia-se no Ultralytics YOLOv5 e introduz duas grandes inovações: Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
O PGI ajuda o YOLOv9 a reter informações importantes à medida que processa dados através de suas camadas, o que leva a resultados mais precisos. Enquanto isso, o GELAN melhora a forma como o modelo usa suas camadas, aumentando o desempenho e a eficiência computacional. Graças a essas atualizações, o YOLOv9 pode lidar com tarefas em tempo real em dispositivos de borda e aplicativos móveis, onde os recursos de computação são frequentemente limitados.

Fig 2. Entendendo como o GELAN melhora a precisão do YOLOv9.
Link to this sectionPrincipais recursos do YOLOv9#
Aqui está uma visão rápida de alguns dos outros recursos principais do YOLOv9:
- Alta precisão com eficiência: O YOLOv9 oferece alta precisão de detecção sem consumir muito poder de computação, tornando-o uma ótima escolha quando os recursos são limitados.
- Modelos leves: As variantes leves de modelos do YOLOv9 são otimizadas para implantações em borda e dispositivos móveis.
- Fácil de usar: O YOLOv9 é suportado pelo pacote Python da Ultralytics, por isso é simples de configurar e executar em diferentes ambientes, estejas tu a usar código ou a linha de comando.
Link to this sectionO YOLOv10 permite detecção de objetos sem NMS#
O YOLOv10 foi introduzido em 23 de maio de 2024 por pesquisadores da Tsinghua University e foca na detecção de objetos em tempo real. Ele aborda limitações das versões anteriores do YOLO ao remover a necessidade de non-maximum suppression (NMS), uma etapa de pós-processamento usada para eliminar detecções duplicadas, e refinar o design geral do modelo. Isso resulta em uma detecção de objetos mais rápida e eficiente, enquanto ainda alcança uma precisão de última geração.
Uma parte vital que torna isso possível é uma abordagem de treinamento conhecida como atribuições de rótulo duplo consistentes (consistent dual-label assignments). Ela combina duas estratégias: uma que permite que múltiplas previsões aprendam com o mesmo objeto (one-to-many) e outra que foca em escolher a melhor previsão única (one-to-one). Como ambas as estratégias seguem as mesmas regras de correspondência, o modelo aprende a evitar duplicatas por conta própria, portanto, o NMS não é necessário.

Fig 3. O YOLOv10 usa atribuições de rótulo duplo consistentes para treinamento sem NMS.
A arquitetura do YOLOv10 também usa um backbone CSPNet aprimorado para aprender características de forma mais eficaz e um neck PAN (Path Aggregation Network) que combina informações de diferentes camadas, tornando-o melhor na detecção de objetos pequenos e grandes. Essas melhorias tornam possível usar o YOLOv10 para aplicações do mundo real na fabricação, varejo e direção autônoma.
Link to this sectionPrincipais recursos do YOLOv10#
Aqui estão alguns dos outros recursos de destaque do YOLOv10:
-
Convoluções de grande kernel: O modelo usa convoluções de grande kernel para capturar mais contexto de áreas mais amplas da imagem, ajudando-o a entender melhor a cena geral.
-
Módulos de autoatenção parcial: O modelo incorpora módulos de autoatenção parcial para focar nas partes mais importantes da imagem sem usar muito poder de computação, aumentando o desempenho de forma eficiente.
-
Variante de modelo única: Junto com os tamanhos usuais do YOLOv10 - Nano, Small, Medium, Large e X - há também uma versão especial chamada YOLOv10b (Balanced). É um modelo mais largo, o que significa que processa mais características em cada camada, o que ajuda a melhorar a precisão enquanto equilibra velocidade e tamanho.
-
Fácil de usar: O YOLOv10 é compatível com o pacote Python da Ultralytics, tornando-o fácil de utilizar.
Link to this sectionUltralytics YOLO11: Velocidade e precisão aprimoradas#
Este ano, em 30 de setembro, a Ultralytics lançou oficialmente o YOLO11 - um dos modelos mais recentes da série YOLO - no seu evento híbrido anual, YOLO Vision 2024 (YV24).
Este lançamento introduziu melhorias significativas em relação às versões anteriores. O YOLO11 é mais rápido, mais preciso e altamente eficiente. Ele suporta a gama completa de tarefas de computer vision com as quais os usuários do YOLOv8 estão familiarizados, incluindo detecção de objetos, segmentação de instâncias e classificação de imagens. Ele também mantém a compatibilidade com fluxos de trabalho do YOLOv8, facilitando a transição dos usuários para a nova versão.
Além disso, o YOLO11 foi projetado para atender a uma ampla gama de necessidades computacionais - desde dispositivos de borda leves até poderosos sistemas de nuvem. O modelo está disponível nas versões open-source e enterprise, tornando-o adaptável para diferentes casos de uso.
É uma ótima opção para tarefas de precisão como imagens médicas e detecção por satélite, bem como aplicações mais amplas em veículos autônomos, agricultura e saúde.

Fig 4. Usando o Ultralytics YOLO11 para detectar, contar e rastrear tráfego.
Link to this sectionPrincipais recursos do YOLO11#
Aqui estão alguns dos outros recursos únicos do YOLO11:
- Detecção rápida e eficiente: O YOLO11 possui uma head de detecção projetada para latência mínima, focando na velocidade nas camadas de previsão finais sem comprometer o desempenho.
- Extração de características aprimorada: Uma arquitetura de backbone e neck otimizada aprimora a extração de características, levando a previsões mais precisas.
- Implantação perfeita entre plataformas: O YOLO11 é otimizado para rodar eficientemente em dispositivos de borda, plataformas de nuvem e GPUs NVIDIA, garantindo adaptabilidade entre diferentes ambientes.
Link to this sectionBenchmarking de modelos YOLO no conjunto de dados COCO#
Ao explorar diferentes modelos, nem sempre é fácil compará-los apenas olhando para seus recursos. É aí que entra o benchmarking. Ao executar todos os modelos no mesmo conjunto de dados, podemos medir e comparar objetivamente seu desempenho. Vamos dar uma olhada em como cada modelo se comporta no conjunto de dados COCO.
Ao comparar modelos YOLO, cada nova versão traz melhorias notáveis em relação à precisão, velocidade e flexibilidade. Em particular, o YOLO11m dá um salto aqui, pois usa 22% menos parâmetros que o YOLOv8m, o que significa que é mais leve e mais rápido de executar. Além disso, apesar de seu tamanho menor, ele atinge uma mean average precision (mAP) maior no conjunto de dados COCO. Essa métrica mede quão bem o modelo detecta e localiza objetos, portanto, um mAP mais alto significa previsões mais precisas.

Fig 5. Benchmarking do YOLO11 e outros modelos YOLO no conjunto de dados COCO.
Link to this sectionTestando e comparando modelos YOLO em um vídeo#
Vamos explorar como esses modelos se comportam em uma situação do mundo real.
Para comparar YOLOv8, YOLOv9, YOLOv10 e YOLO11, todos os quatro foram executados no mesmo vídeo de tráfego usando uma pontuação de confiança de 0.3 (o modelo apenas exibe detecções quando está pelo menos 30% confiante de que identificou corretamente um objeto) e um tamanho de imagem de 640 para uma avaliação justa. Os resultados de detecção e rastreamento de objetos destacaram as principais diferenças na precisão, velocidade e exatidão da detecção.
A partir do primeiro frame, o YOLO11 detectou veículos grandes como caminhões que o YOLOv10 perdeu. O YOLOv8 e o YOLOv9 mostraram um desempenho decente, mas variaram dependendo das condições de iluminação e do tamanho do objeto. Veículos menores e distantes permaneceram um desafio em todos os modelos, embora o YOLO11 tenha mostrado melhorias notáveis nessas detecções também.

Fig 6. Comparando YOLOv8, YOLOv9, YOLOv10 e YOLO11.
Em termos de velocidade, todos os modelos operaram entre 10 e 20 milissegundos por frame, rápido o suficiente para lidar com tarefas em tempo real a mais de 50 FPS. Por um lado, o YOLOv8 e o YOLOv9 forneceram detecções estáveis e confiáveis durante todo o vídeo. Curiosamente, o YOLOv10, projetado para menor latência, foi mais rápido, mas mostrou algumas inconsistências na detecção de certos tipos de objetos.
O YOLO11, por outro lado, destacou-se pela sua precisão, oferecendo um forte equilíbrio entre velocidade e accuracy. Embora nenhum dos modelos tenha tido um desempenho perfeito em todos os frames, a comparação lado a lado demonstrou claramente que o YOLO11 ofereceu o melhor desempenho geral.
Link to this sectionQual modelo YOLO é o melhor para tarefas de computer vision?#
A seleção de um modelo para um projeto depende dos seus requisitos específicos. Por exemplo, algumas aplicações podem priorizar a velocidade, enquanto outras podem exigir maior precisão ou enfrentar restrições de implantação que influenciam a decisão.
Outro fator importante é o tipo de tarefa de computer vision que precisas de abordar. Se procuras uma maior flexibilidade em diferentes tarefas, o YOLOv8 e o YOLO11 são boas opções.
Escolher entre o YOLOv8 ou o YOLO11 depende realmente das tuas necessidades. O YOLOv8 é uma opção sólida se fores novo em computer vision e valorizares uma comunidade maior, mais tutoriais e extensas integrações de terceiros.
Por outro lado, se procuras um desempenho de ponta com melhor precisão e velocidade, o YOLO11 é a melhor escolha, embora venha com uma comunidade menor e menos integrações por ser um lançamento mais recente.
Link to this sectionPrincipais pontos#
Do Ultralytics YOLOv8 ao Ultralytics YOLO11, a evolução da série de modelos YOLO reflete um esforço consistente em direção a modelos de computer vision mais inteligentes. Cada versão do YOLO traz atualizações significativas em termos de velocidade, precisão e exatidão.
À medida que a computer vision continua a avançar, esses modelos oferecem soluções confiáveis para desafios do mundo real, desde a detecção de objetos até sistemas autônomos. O desenvolvimento contínuo dos modelos YOLO mostra o quão longe o campo chegou e o quanto podemos esperar no futuro.
Para saber mais sobre IA, visita o nosso repositório GitHub e envolve-te com a nossa comunidade. Descobre avanços em todos os setores, desde vision AI na fabricação até computer vision na área da saúde. Confere as nossas opções de licenciamento para começar os teus projetos de vision AI hoje.






