Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

O que é detecção de bounding box orientado (OBB)?

Leitura de 5 minutos

9 de junho de 2025

Explore como a detecção de caixa delimitadora orientada (OBB) aprimora a detecção de objetos, identificando com precisão objetos rotacionados em imagens em aplicações do mundo real.

Reconhecer objetos, independentemente de como estejam dispostos ou para que lado estejam virados, é natural para nós, humanos. Sejam carros em um cruzamento ou barcos em um porto, podemos facilmente dizer o que são e para que direção estão apontando. No entanto, para sistemas de inteligência artificial (IA), não é tão simples.

Por exemplo, a visão computacional, um ramo da IA focado na compreensão de imagens e vídeos, permite tarefas como a deteção de objetos, que ajuda as máquinas a identificar e localizar objetos dentro de uma cena. A deteção de objetos tradicional depende de caixas delimitadoras alinhadas ao eixo para desenhar caixas à volta dos objetos. Estas caixas têm lados retos e ângulos retos fixos. Esta abordagem funciona bem quando os objetos estão na vertical e não muito próximos uns dos outros. 

Mas quando os objetos estão inclinados, girados ou próximos uns dos outros, a detecção de objetos tradicional geralmente tem dificuldades para capturá-los com precisão. Para lidar com essas situações mais complexas, técnicas como a detecção de caixa delimitadora orientada (OBB) foram introduzidas. Ao contrário das caixas delimitadoras padrão, as OBBs podem girar para corresponder ao ângulo e à forma do objeto, permitindo um ajuste mais preciso e exato.

Modelos de visão computacional como o Ultralytics YOLO11, que suportam a deteção de OBB, permitem uma gama de aplicações em tempo real, especialmente em cenários onde a orientação do objeto é importante, como a vigilância aérea. Além disso, a deteção de OBB também é usada em cuidados de saúde, agricultura e análise de documentos.

Neste artigo, vamos explorar o que é a detecção OBB, como ela funciona e onde está sendo aplicada em cenários do mundo real. Vamos começar!

__wf_reserved_inherit
Fig. 1. Um exemplo de demonstração da utilização do YOLO11 para deteção OBB de barcos.

O que é uma bounding box orientada?

Uma bounding box orientada é um tipo de caixa retangular usada em visão computacional para representar objetos detectados em uma imagem. Enquanto as bounding boxes padrão estão alinhadas com os eixos horizontal e vertical da imagem, as OBBs podem girar para corresponder ao ângulo real do objeto.

Essa capacidade de rotação traz várias vantagens. As OBBs podem se alinhar mais estreitamente com a orientação de um objeto, permitindo que a caixa se ajuste firmemente ao redor da forma e direção do objeto. Como resultado, a detecção se torna mais precisa.

Os OBBs são especialmente úteis quando os objetos não estão perfeitamente retos, como um carro virando em uma estrada curva em filmagens aéreas, um livro inclinado em uma mesa ou um tumor rotacionado em uma varredura médica. Ao corresponder ao ângulo de um objeto com mais precisão, os OBBs melhoram o desempenho da detecção, reduzem a interferência de fundo e são particularmente ótimos para aplicações onde a orientação de um objeto importa tanto quanto sua posição.

__wf_reserved_inherit
Fig 2. Comparando a detecção de objetos e a detecção OBB.

Detecção OBB vs. detecção de objetos

A detecção OBB e a detecção de objetos tradicional podem parecer semelhantes à primeira vista, mas são usadas de maneiras diferentes e para situações diferentes. Vamos dar uma olhada mais de perto em como elas se comparam com um exemplo.

Modelos de visão computacional, como o YOLO11, podem ser treinados para detectar e classificar objetos em várias aplicações do mundo real, como inspeção industrial. Considere uma linha de montagem de fábrica onde diferentes peças de máquinas se movem ao longo de uma esteira transportadora. Algumas peças podem ser colocadas de forma organizada, mas outras podem ser giradas ligeiramente, inclinadas ou sobrepostas devido à vibração ou velocidade.

A detecção de objetos tradicional usa caixas retangulares verticais que se alinham com as bordas horizontais e verticais da imagem. Portanto, quando uma peça é girada, a caixa pode não se encaixar corretamente - pode deixar de fora parte do objeto ou incluir muito do fundo. Isso pode tornar as detecções menos precisas e mais difíceis para o sistema identificar a peça com confiança.

Agora, digamos que você esteja usando a detecção OBB. Nesse caso, o modelo pode desenhar uma caixa que gira para corresponder ao ângulo exato de cada peça. Uma engrenagem inclinada ou um componente angulado será firmemente envolvido por uma caixa que se ajusta à sua forma e direção. Isso significa melhor precisão, menos erros e resultados mais confiáveis, especialmente com relação a casos de uso como controle de qualidade automatizado ou classificação robótica.

Modelos populares de detecção OBB

Agora que temos uma melhor compreensão do que é a detecção OBB, vamos dar uma olhada em alguns dos modelos de Visão de IA mais amplamente utilizados que a suportam.

Vários modelos avançados de visão computacional foram desenvolvidos especificamente para detectar objetos rotacionados ou inclinados. Entre eles, os modelos YOLO da Ultralytics são particularmente conhecidos por suas capacidades de detecção OBB (Oriented Bounding Box) confiáveis e eficientes.

Versões anteriores como Ultralytics YOLOv5 foram projetadas para detecção de objetos padrão. Iterações posteriores, como Ultralytics YOLOv8 e o mais recente YOLO11, introduziram suporte nativo para detecção OBB. YOLO11, em particular, oferece precisão de última geração sem comprometer a velocidade, tornando-o uma opção impactante para aplicações em tempo real.

Modelos YOLO11 OBB pré-treinados, como YOLO11n-obb, são treinados em conjuntos de dados como DOTAv1, que consiste em imagens aéreas anotadas com uma variedade de classes de objetos, como aviões, navios e quadras de tênis que aparecem em vários ângulos e orientações. 

Além disso, esses modelos estão disponíveis em cinco tamanhos diferentes, de nano (n-obb) a extra-grande (x-obb), para corresponder a diferentes necessidades de desempenho. Essa versatilidade permite que sejam aplicados em vários setores - desde o monitoramento de infraestrutura urbana e inspeção de máquinas até a leitura de texto distorcido em documentos digitalizados.

Treinamento personalizado do YOLO11 para detecção de caixas delimitadoras orientadas

Em muitas situações do mundo real, os objetos que você precisa detectar podem ser totalmente diferentes daqueles em conjuntos de dados de treinamento padrão. Por exemplo, objetos como ferramentas em uma linha de produção, embalagens de produtos ou componentes em uma placa de circuito podem ser rotacionados, colocados irregularmente ou ter formatos diferentes. 

Para detectar com precisão esses objetos personalizados, especialmente quando a orientação é importante, é fundamental treinar modelos como o YOLO11 usando suas próprias imagens e rótulos. Este processo é conhecido como treinamento personalizado

Aqui está uma análise mais detalhada do processo passo a passo para treinar o YOLO11 para detecção OBB:

  • Coleta de imagens: Reúna imagens que mostrem seus objetos-alvo de diferentes ângulos, posições e ambientes do mundo real.
  • Anotação de objeto: Rotule cada objeto usando caixas delimitadoras rotacionadas (OBBs) para capturar sua localização e orientação usando ferramentas de anotação com suporte a OBB.
  • Preparação do conjunto de dados: Organize suas imagens e rótulos na estrutura de diretórios YOLO e crie um arquivo de configuração YAML com os nomes das suas classes e os caminhos do conjunto de dados.
  • Treinamento de modelo: Escolha uma versão do modelo YOLO11 que se adapte às suas necessidades e execute o processo de treinamento para que o modelo possa aprender com as suas imagens rotuladas.
  • Avaliação e implantação: Teste seu modelo treinado em novas imagens, avalie sua precisão e implante-o em aplicações práticas como manufatura, vigilância aérea ou análise de documentos.

Aplicações habilitadas pela detecção OBB

Objetos que estão descentralizados ou inclinados são bastante comuns em cenários da vida real. Vamos percorrer alguns exemplos onde a detecção de OBB faz uma diferença real ao detectar com precisão esses objetos.

Análise de imagem de raio-X usando detecção OBB

A detecção OBB pode levar a análise de imagens médicas um passo adiante, melhorando a precisão. As imagens médicas geralmente incluem estruturas anatômicas, como tumores, órgãos ou ossos. Essas estruturas geralmente aparecem em formas irregulares e orientações variadas. Como os OBBs podem girar para corresponder ao ângulo de um objeto, eles fornecem uma localização e medição mais precisas, o que é fundamental para o diagnóstico e o planejamento do tratamento.

Esta abordagem é especialmente eficaz quando se trata de analisar imagens de raios-X de fraturas ósseas, onde a posição e o alinhamento dos ossos são fatores-chave. Por exemplo, a deteção de OBB tem sido usada para analisar raios-X de cotovelo pediátrico. Ao ajustar-se à orientação dos ossos, ajudou a melhorar a precisão da deteção. 

__wf_reserved_inherit
Fig. 3. Raios-X (a, d) com deteção de objetos (b, e) e deteção de caixas delimitadoras orientadas (c, f).

Vigilância aérea impulsionada pela detecção de OBB

A vigilância aérea é uma ferramenta essencial em setores como segurança pública, monitoramento ambiental e planejamento urbano. Imagens capturadas por drones ou satélites podem ajudar a identificar objetos como navios, veículos e edifícios. No entanto, nessas imagens, os objetos geralmente aparecem pequenos e em ângulos incomuns, tornando-os mais difíceis de detectar com precisão.

A detecção OBB resolve isso inclinando as caixas delimitadoras para corresponder ao ângulo de cada objeto. Isso leva a medições mais precisas do tamanho e orientação de um objeto, apoiando uma melhor tomada de decisão em áreas como planejamento urbano, defesa, resposta a desastres e monitoramento ambiental.

Um exemplo interessante de detecção de OBB é o rastreamento de navios em vigilância marítima. As imagens de satélite frequentemente capturam navios em vários ângulos e tamanhos devido ao clima, iluminação ou movimento. Os OBBs podem se adaptar a essas mudanças, melhorando a detecção, especialmente para embarcações menores ou parcialmente obscurecidas.

__wf_reserved_inherit
Fig 4. Uma visão sobre o uso da detecção OBB para vigilância marítima.

Usando detecção OBB na agricultura

A triagem de colheitas após a colheita é uma etapa crucial para garantir a qualidade antes de serem embaladas e enviadas para o mercado. Embora muitos sistemas funcionem bem para frutas redondas, como maçãs e laranjas, colheitas longas e estreitas, como cenouras ou brotos de Zizania, podem ser muito mais difíceis de manusear. Suas formas variam e, muitas vezes, acabam em ângulos diferentes, tornando-as difíceis de detectar e classificar com precisão.

Para resolver isto, os investigadores desenvolveram um sistema que usa a detecção de caixas delimitadoras orientadas (OBB) para identificar e classificar estas culturas com mais precisão. O sistema pode detetar várias culturas numa imagem, mesmo que estejam inclinadas ou sobrepostas, e avaliar a sua qualidade e posição em tempo real.

Prós e contras da detecção OBB

Aqui estão alguns dos benefícios de usar a detecção OBB:

  • Entrada aprimorada para tarefas downstream: Tarefas de visão computacional como segmentação de instâncias e rastreamento de objetos podem ter um desempenho melhor quando recebem detecções de objetos mais precisas.

  • Raciocínio espacial aprimorado: Ao capturar o ângulo de orientação, os OBBs possibilitam a compreensão do alinhamento e da direção de um objeto.

  • Redução da sobreposição em cenas lotadas: Os OBBs reduzem a ambiguidade ao ajustar os objetos de forma mais precisa, mesmo em cenas movimentadas ou confusas.

Apesar de ajudar a melhorar a precisão da detecção em cenas complexas, a detecção OBB apresenta algumas limitações a serem consideradas:

  • Maior sensibilidade ao ruído: Pequenos erros na previsão do ângulo podem ter um impacto maior na precisão da detecção, especialmente para objetos compactados ou alongados.
  • Ferramentas especializadas necessárias: Como nem todas as plataformas de rotulagem e treinamento suportam nativamente OBBs, trabalhar com elas pode exigir ferramentas ou configurações adicionais.

  • Disponibilidade limitada de conjuntos de dados: Comparado com a detecção de objetos padrão, atualmente existem menos conjuntos de dados disponíveis publicamente com anotações OBB, o que pode tornar um pouco mais desafiador começar ou comparar resultados.

Principais conclusões

A detecção de caixas delimitadoras orientadas facilita o reconhecimento de objetos que não estão perfeitamente retos ou alinhados para soluções de visão computacional. Ao capturar a posição e a orientação dos objetos, a detecção OBB aumenta a precisão em casos de uso do mundo real, como digitalização de imagens médicas, monitoramento de terras agrícolas ou análise de fotos de satélite.

Com modelos como o YOLO11 tornando a detecção de OBB mais acessível, ela está se tornando uma escolha prática para muitos setores. Se você está lidando com objetos inclinados, sobrepostos ou com formatos estranhos, a detecção de OBB adiciona uma camada extra de precisão que os métodos padrão geralmente perdem.

Tem curiosidade sobre IA? Explore nosso repositório no GitHub, conecte-se com nossa comunidade e confira nossas opções de licenciamento para dar o pontapé inicial no seu projeto de visão computacional. Saiba mais sobre inovações como IA no varejo e visão computacional na indústria de logística em nossas páginas de soluções.

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência