Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
IA de visão

YOLO12 explicado: Aplicações e casos de uso no mundo real

Descubra o YOLO12, o mais novo modelo de visão computacional! Aprenda como sua arquitetura centrada em atenção e a tecnologia FlashAttention aprimoram tarefas de detecção de objetos em todos os setores.

ABAbirami Vina
5 min read
Detecção de objetos YOLO12 em aplicações do mundo real

A visão computacional é um ramo da inteligência artificial (IA) que ajuda máquinas a entenderem imagens e vídeos. É um campo que avança a um ritmo incrível porque pesquisadores e desenvolvedores de IA estão constantemente superando limites. A comunidade de IA busca sempre tornar os modelos mais rápidos, inteligentes e eficientes. Um dos avanços mais recentes é o YOLO12, a mais nova adição à série de modelos YOLO (You Only Look Once), lançado em 18 de fevereiro de 2025.

O YOLO12 foi desenvolvido por pesquisadores da University at Buffalo, SUNY (State University of New York) e da University of Chinese Academy of Sciences. Em uma abordagem nova e única, o YOLO12 introduz mecanismos de atenção, permitindo que o modelo foque nas partes mais essenciais de uma imagem em vez de processar tudo da mesma forma.

Ele também conta com FlashAttention, uma técnica que acelera o processamento usando menos memória, e um mecanismo de atenção de área, projetado para imitar a maneira como os humanos focam naturalmente em objetos centrais.

Essas melhorias tornam o YOLO12n 2,1% mais preciso que o YOLOv10n e o YOLO12m 1,0% mais preciso que o YOLO11m. No entanto, isso traz um compromisso: o YOLO12n é 9% mais lento que o YOLOv10n, e o YOLO12m é 3% mais lento que o YOLO11m.

YOLO12 sendo usado para detectar objetos

Fig 1. Um exemplo do YOLO12 sendo usado para detectar objetos.

Neste artigo, exploraremos o que torna o YOLO12 diferente, como ele se compara às versões anteriores e onde pode ser aplicado.

Link to this sectionA trajetória até o lançamento do YOLO12#

A série de modelos YOLO é uma coleção de modelos de visão computacional projetados para detecção de objetos em tempo real, o que significa que podem identificar e localizar rapidamente objetos em imagens e vídeos. Com o tempo, cada versão melhorou em termos de velocidade, precisão e eficiência.

Por exemplo, o Ultralytics YOLOv5, lançado em 2020, tornou-se amplamente utilizado por ser rápido e fácil de treinar e implantar de forma personalizada. Posteriormente, o Ultralytics YOLOv8 melhorou isso ao oferecer suporte adicional para tarefas de visão computacional, como segmentação de instâncias e rastreamento de objetos.

Mais recentemente, o Ultralytics YOLO11 focou em melhorar o processamento em tempo real, mantendo um equilíbrio entre velocidade e precisão. Por exemplo, o YOLO11m tinha 22% menos parâmetros que o YOLOv8m, mas ainda entregou um desempenho de detecção melhor no conjunto de dados COCO, um benchmark amplamente utilizado para avaliar modelos de detecção de objetos.

Com base nesses avanços, o YOLO12 introduz uma mudança na forma como processa informações visuais. Em vez de tratar todas as partes de uma imagem da mesma forma, ele prioriza as áreas mais relevantes, melhorando a precisão da detecção. Simplificando, o YOLO12 baseia-se em melhorias anteriores enquanto busca ser mais preciso.

Link to this sectionPrincipais recursos do YOLO12#

O YOLO12 introduz várias melhorias que aprimoram tarefas de visão computacional, mantendo velocidades de processamento em tempo real. Aqui está uma visão geral dos principais recursos do YOLO12:

  • Arquitetura centrada em atenção: Em vez de tratar cada parte de uma imagem igualmente, o YOLO12 foca nas áreas mais importantes. Isso melhora a precisão e reduz o processamento desnecessário, tornando a detecção mais nítida e eficiente, mesmo em imagens com muitos elementos.
  • FlashAttention: O YOLO12 acelera a análise de imagens usando menos memória. Com o FlashAttention (um algoritmo eficiente em termos de memória), ele otimiza o tratamento de dados, reduzindo o esforço do hardware e tornando tarefas em tempo real mais fluidas e confiáveis.
  • Residual Efficient Layer Aggregation Networks (R-ELAN): O YOLO12 organiza suas camadas de forma mais eficiente usando R-ELAN, o que melhora a maneira como o modelo processa e aprende com os dados. Isso torna o treinamento mais estável, o reconhecimento de objetos mais nítido e os requisitos computacionais menores, permitindo que funcione de forma eficiente em diferentes ambientes.

Para entender como esses recursos funcionam na prática, imagine um shopping center. O YOLO12 pode ajudar a rastrear clientes, identificar decorações de lojas, como plantas em vasos ou placas promocionais, e localizar itens perdidos ou abandonados.

Sua arquitetura centrada em atenção ajuda a focar nos detalhes mais importantes, enquanto o FlashAttention garante o processamento rápido sem sobrecarregar o sistema. Isso torna mais fácil para os administradores do shopping melhorar a segurança, organizar layouts de lojas e aprimorar a experiência geral de compra.

Detectando objetos em um shopping usando YOLO12

Fig 2. Detectando objetos em um shopping center usando YOLO12.

No entanto, o YOLO12 também traz algumas limitações a serem consideradas:

  • Tempos de treinamento mais lentos: Devido à sua arquitetura, o YOLO12 requer mais tempo de treinamento em comparação com o YOLO11.
  • Desafios de exportação: Alguns usuários podem encontrar dificuldades ao exportar modelos YOLO12, especialmente ao integrá-los em ambientes de implantação específicos.

Link to this sectionEntendendo os benchmarks de desempenho do YOLO12#

O YOLO12 vem em várias variantes, cada uma otimizada para necessidades diferentes. Versões menores (nano e small) priorizam velocidade e eficiência, tornando-as ideais para dispositivos móveis e edge computing. As versões medium e large equilibram velocidade e precisão, enquanto o YOLO12x (extra large) é projetado para aplicações de alta precisão, como automação industrial, imagens médicas e sistemas de vigilância avançados.

Com essas variações, o YOLO12 oferece diferentes níveis de desempenho dependendo do tamanho do modelo. Testes de benchmark mostram que certas variantes do YOLO12 superam o YOLOv10 e o YOLO11 em precisão, alcançando maior mAP (mean average precision).

No entanto, alguns modelos, como YOLO12m, YOLO12l e YOLO12x, processam imagens de forma mais lenta que o YOLO11, mostrando um compromisso entre precisão de detecção e velocidade. Apesar disso, o YOLO12 permanece eficiente, exigindo menos parâmetros que muitos outros modelos, embora ainda use mais que o YOLO11. Isso o torna uma ótima escolha para aplicações onde a precisão é mais importante do que a velocidade bruta.

Comparando Ultralytics YOLO11 e YOLO12

Fig 3. Comparando Ultralytics YOLO11 e YOLO12.

Link to this sectionUsando o YOLO12 através do pacote Python da Ultralytics#

O YOLO12 é suportado pelo pacote Python da Ultralytics e é fácil de usar, tornando-o acessível tanto para iniciantes quanto para profissionais. Com apenas algumas linhas de código, os usuários podem carregar modelos pré-treinados, executar várias tarefas de visão computacional em imagens e vídeos e também treinar o YOLO12 em conjuntos de dados personalizados. O pacote Python da Ultralytics simplifica o processo, eliminando a necessidade de etapas complexas de configuração.

Por exemplo, aqui estão os passos que você seguiria para usar o YOLO12 para detecção de objetos:

  • Instalar o pacote Ultralytics: Primeiro, instale o pacote Python da Ultralytics, que fornece as ferramentas necessárias para executar o YOLO12 de forma eficiente. Isso garante que todas as dependências estejam configuradas corretamente.
  • Carregar um modelo YOLO12 pré-treinado: Escolha a variante do YOLO12 apropriada (nano, small, medium, large ou extra large) com base no nível de precisão e velocidade necessários para sua tarefa.
  • Fornecer uma imagem ou vídeo: Insira uma imagem ou arquivo de vídeo que você deseja analisar. O YOLO12 também pode processar feeds de vídeo ao vivo para detecção em tempo real.
  • Executar o processo de detecção: O modelo escaneia os dados visuais, identifica objetos e coloca caixas delimitadoras (bounding boxes) ao redor deles. Ele rotula cada objeto detectado com sua classe prevista e pontuação de confiança.
  • Ajustar as configurações de detecção: Você também pode modificar parâmetros, como limites de confiança, para ajustar a precisão e o desempenho da detecção.
  • Salvar ou usar a saída: A imagem ou vídeo processado, agora contendo objetos detectados, pode ser salvo ou integrado a um aplicativo para análise adicional, automação ou tomada de decisão.

Essas etapas tornam o YOLO12 fácil de usar para uma variedade de aplicações, desde vigilância e rastreamento no varejo até imagens médicas e veículos autônomos.

Link to this sectionAplicações práticas do YOLO12#

O YOLO12 pode ser usado em uma variedade de aplicações do mundo real graças ao seu suporte para detecção de objetos, segmentação de instâncias, classificação de imagens, estimativa de pose e detecção de objetos orientados (OBB).

YOLO12 suportando tarefas como detecção de objetos e segmentação de instâncias

Fig 4. O YOLO12 suporta tarefas como detecção de objetos e segmentação de instâncias.

No entanto, como discutimos anteriormente, os modelos YOLO12 priorizam a precisão sobre a velocidade, o que significa que eles demoram um pouco mais para processar imagens em comparação com as versões anteriores. Esse compromisso torna o YOLO12 ideal para aplicações onde a precisão é mais importante do que a velocidade em tempo real, como:

  • Imagens médicas: O YOLO12 pode ser treinado de forma personalizada para detectar tumores ou anormalidades em raios-X e ressonâncias magnéticas com alta precisão, tornando-o uma ferramenta útil para médicos e radiologistas que precisam de análise de imagem precisa para diagnóstico.
  • Controle de qualidade na fabricação: Ele pode ajudar a identificar defeitos de produtos durante o processo de fabricação, garantindo que apenas itens de alta qualidade cheguem ao mercado enquanto reduz o desperdício e melhora a eficiência.
  • Análise forense: Agências de aplicação da lei podem ajustar o YOLO12 para analisar imagens de vigilância e reunir evidências. Em investigações criminais, a precisão é vital para identificar detalhes importantes.
  • Agricultura de precisão: Os agricultores podem usar o YOLO12 para analisar a saúde das culturas, detectar doenças ou infestações de pragas e monitorar as condições do solo. Avaliações precisas ajudam a otimizar estratégias de cultivo, levando a um melhor rendimento e gerenciamento de recursos.

Link to this sectionComeçando com o YOLO12#

Antes de executar o YOLO12, é importante garantir que seu sistema atenda aos requisitos necessários.

Tecnicamente, o YOLO12 pode rodar em qualquer GPU (Graphics Processing Unit) dedicada. Por padrão, ele não exige FlashAttention, então funciona na maioria dos sistemas GPU sem ele. No entanto, habilitar o FlashAttention pode ser especialmente útil ao trabalhar com grandes conjuntos de dados ou imagens de alta resolução, pois ajuda a evitar lentidões, reduzir o uso de memória e melhorar a eficiência do processamento.

Para usar o FlashAttention, você precisará de uma GPU NVIDIA de uma destas séries: Turing (T4, Quadro RTX), Ampere (RTX série 30, A30, A40, A100), Ada Lovelace (RTX série 40) ou Hopper (H100, H200).

Tendo em mente a usabilidade e a acessibilidade, o pacote Python da Ultralytics ainda não suporta inferência com FlashAttention, pois sua instalação pode ser tecnicamente complexa. Para saber mais sobre como começar com o YOLO12 e otimizar seu desempenho, confira a documentação oficial da Ultralytics.

Link to this sectionPrincipais pontos#

À medida que a visão computacional avança, os modelos estão se tornando mais precisos e eficientes. O YOLO12 melhora tarefas de visão computacional como detecção de objetos, segmentação de instâncias e classificação de imagens com processamento centrado em atenção e FlashAttention, aumentando a precisão enquanto otimiza o uso de memória.

Ao mesmo tempo, a visão computacional está mais acessível do que nunca. O YOLO12 é fácil de usar através do pacote Python da Ultralytics e, com seu foco na precisão sobre a velocidade, é bem adequado para imagens médicas, inspeções industriais e robótica - aplicações onde a precisão é fundamental.

Curioso sobre IA? Visite nosso repositório no GitHub e interaja com nossa comunidade. Explore inovações em setores como IA em carros autônomos e visão computacional na agricultura em nossas páginas de soluções. Confira nossas opções de licenciamento e dê vida aos seus projetos de IA visual. 🚀

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática