Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Guias

Tudo o que você precisa saber sobre tarefas de visão computacional

Aprenda como funcionam tarefas de visão computacional como rastreamento de objetos, segmentação de instâncias e classificação de imagens, e como o Ultralytics YOLO11 as suporta.

ABAbirami Vina
4 min read
Tarefas de visão computacional suportadas pelo Ultralytics YOLO11

Graças às câmaras e aos avanços na inteligência artificial (IA), os computadores e as máquinas são agora capazes de ver o mundo de uma forma semelhante à dos humanos. Por exemplo, podem reconhecer pessoas, seguir objetos e até compreender o contexto do que está a acontecer num vídeo.

Especificamente, a visão computacional é o ramo da IA que permite às máquinas compreender e interpretar informações visuais do mundo que as rodeia. A visão computacional envolve uma variedade de tarefas, cada uma concebida para extrair um tipo específico de informação de imagens ou vídeos. Por exemplo, a deteção de objetos ajuda a identificar e localizar diferentes elementos numa imagem, enquanto outras tarefas como o seguimento, a segmentação e a estimativa de pose ajudam as máquinas a compreender o movimento, as formas e as posições com maior precisão.

A tarefa de visão computacional utilizada para uma aplicação específica depende do tipo de informações de que precisas. Modelos de visão computacional como o Ultralytics YOLO11 suportam várias tarefas de visão computacional, tornando-os uma escolha fiável para a construção de sistemas de Vision AI do mundo real.

Neste guia, analisaremos mais de perto as tarefas de visão computacional suportadas por modelos como o YOLO11. Vamos explorar como cada tarefa funciona e como estão a ser utilizadas em diferentes setores. Vamos começar!

Link to this sectionO que são tarefas de visão computacional?#

As tarefas de visão computacional visam replicar as capacidades da visão humana de diferentes formas. Estas tarefas podem ajudar as máquinas a detetar objetos, seguir os seus movimentos, estimar poses e até delinear elementos individuais em imagens e vídeos. Normalmente, as tarefas de visão computacional são ativadas por modelos que decompõem os dados visuais em partes mais pequenas para que possam interpretar o que está a acontecer com maior clareza.

Modelos de Vision AI como os modelos Ultralytics YOLO suportam múltiplas tarefas, como deteção, seguimento e segmentação, numa única estrutura. Devido a esta versatilidade, os modelos YOLO11 são fáceis de adotar para uma grande variedade de casos de utilização.

Tarefas de visão computacional suportadas pelo YOLO11

Fig 1. Tarefas de visão computacional suportadas pelo YOLO11.

Um bom exemplo disto é a análise desportiva. O YOLO11 pode ser usado para detetar cada jogador no campo utilizando a deteção de objetos, e depois pode segui-los ao longo do jogo com o seguimento de objetos. Entretanto, as capacidades de estimativa de pose do YOLO11 podem ajudar a analisar os movimentos e técnicas dos jogadores, e a segmentação de instâncias pode separar cada jogador do fundo, conferindo precisão à análise.

Juntas, estas tarefas de visão computacional possibilitadas pelo YOLO11 criam uma imagem completa do que está a acontecer durante o jogo, dando às equipas informações mais profundas sobre o desempenho dos jogadores, táticas e estratégia geral.

Link to this sectionUma visão geral das tarefas de visão computacional suportadas pelo YOLO11#

Agora que vimos o que são as tarefas de visão computacional, vamos mergulhar na compreensão detalhada de cada uma suportada pelo YOLO11, utilizando exemplos do mundo real.

Link to this sectionO suporte do YOLO11 para a classificação de imagens#

Quando olhas para uma fotografia, a maioria das pessoas consegue facilmente dizer se ela mostra um cão, uma montanha ou um sinal de trânsito, porque todos aprendemos como essas coisas costumam ser. A classificação de imagens ajuda as máquinas a fazer o mesmo, ensinando-as a classificar e rotular uma imagem com base no seu objeto principal - seja um "carro", "banana" ou uma "radiografia com fratura". Este rótulo ajuda os sistemas de visão computacional a compreender o conteúdo visual para que possam responder ou tomar decisões em conformidade.

Uma aplicação interessante desta tarefa de visão computacional é a monitorização da vida selvagem. A classificação de imagens pode ser usada para identificar diferentes espécies animais a partir de fotografias tiradas na natureza. Ao rotular automaticamente as imagens, os investigadores podem seguir populações, monitorizar padrões de migração e identificar espécies ameaçadas mais facilmente para apoiar os esforços de conservação.

Usando YOLO11 para classificação de imagens

Fig 2. Um exemplo de utilização do YOLO11 para classificação de imagens.

Link to this sectionAs capacidades de deteção de objetos do YOLO11#

Embora a classificação de imagens seja útil para ter uma ideia geral do que uma imagem contém, ela atribui apenas um rótulo a toda a imagem. Em situações em que são necessárias informações detalhadas, como a localização precisa e a identidade de múltiplos objetos, a deteção de objetos torna-se essencial.

A deteção de objetos é o processo de identificar e localizar objetos individuais dentro de uma imagem, muitas vezes desenhando caixas delimitadoras (bounding boxes) à sua volta. O Ultralytics YOLO11 tem um desempenho especialmente bom na deteção de objetos em tempo real, tornando-o ideal para uma vasta gama de aplicações.

Pega, por exemplo, nas soluções de visão computacional utilizadas em lojas de retalho para o abastecimento de prateleiras. A deteção de objetos pode ajudar a contar frutos, legumes e outros artigos, garantindo um inventário preciso. Em campos agrícolas, a mesma tecnologia pode monitorizar a maturação das culturas para ajudar os agricultores a determinar a melhor altura para a colheita, distinguindo até entre produtos maduros e verdes.

Detecção de frutas usando Ultralytics YOLO11

Fig 3. Deteção de frutos usando o Ultralytics YOLO11.

Link to this sectionUsando o YOLO11 para segmentação de instâncias#

A deteção de objetos usa caixas delimitadoras para identificar e localizar objetos numa imagem, mas não captura as suas formas exatas. É aqui que entra a segmentação de instâncias. Em vez de desenhar uma caixa à volta de um objeto, a segmentação de instâncias traça o seu contorno preciso.

Podes pensar nisto da seguinte forma: em vez de simplesmente indicar que "há uma maçã nesta área", ela delineia cuidadosamente e preenche a forma exata da maçã. Este processo detalhado ajuda os sistemas de IA a compreender claramente os limites de um objeto, especialmente quando os objetos estão próximos uns dos outros.

A segmentação de instâncias pode ser aplicada a muitas aplicações, desde inspeções de infraestruturas a levantamentos geológicos. Por exemplo, dados de levantamentos geológicos podem ser analisados usando o YOLO11 para segmentar fissuras ou anomalias superficiais, tanto grandes como pequenas. Ao desenhar limites precisos à volta destas anomalias, os engenheiros podem identificar problemas e resolvê-los antes que um projeto comece.

Segmentação de rachaduras habilitada pelo YOLO11

Fig 4. Segmentação de fissuras ativada pelo YOLO11.

Link to this sectionSeguimento de objetos: Seguir objetos através de fotogramas com o YOLO11#

Até agora, as tarefas de visão computacional que analisámos focam-se no que está numa única imagem. No entanto, quando se trata de vídeos, precisamos de informações que vão para além de um único fotograma. A tarefa, seguimento de objetos, pode ser usada para isso.

A capacidade de seguimento de objetos do YOLO11 pode seguir um objeto específico, como uma pessoa ou um carro, à medida que este se move através de uma série de fotogramas de vídeo. Mesmo que o ângulo da câmara mude ou outros objetos apareçam, o sistema continua a seguir o mesmo alvo.

Isto é crucial para aplicações que requerem monitorização ao longo do tempo, como o seguimento de carros no trânsito. De facto, o YOLO11 pode seguir veículos com precisão, acompanhando cada carro para ajudar a estimar a sua velocidade em tempo real. Isto faz do seguimento de objetos um componente chave em sistemas como a monitorização de tráfego.

Rastreamento de objetos YOLO11 usado para estimativa de velocidade

Fig 5. O suporte do YOLO11 para seguimento de objetos pode ser usado para a estimativa de velocidade.

Link to this sectionDeteção de caixas delimitadoras orientadas (OBB) usando o YOLO11#

Os objetos no mundo real nem sempre estão perfeitamente alinhados - podem estar inclinados, de lado ou posicionados em ângulos estranhos. Por exemplo, em imagens de satélite, os navios e edifícios aparecem frequentemente rodados.

Os métodos tradicionais de deteção de objetos usam caixas retangulares fixas que não se ajustam à orientação de um objeto, tornando difícil capturar com precisão estas formas rodadas. A deteção de caixas delimitadoras orientadas (OBB) resolve este problema ao usar caixas que rodam para se ajustarem perfeitamente a um objeto, alinhando-se com o seu ângulo para uma deteção mais precisa.

Relativamente à monitorização portuária, o suporte do YOLO11 para deteção OBB pode ajudar a identificar e seguir navios com precisão, independentemente da sua orientação, garantindo que cada navio que entra ou sai do porto é devidamente monitorizado. Esta deteção precisa fornece informações em tempo real sobre as posições e movimentos dos navios, o que é fundamental para gerir portos movimentados e evitar colisões.

Detecção de barcos usando detecção OBB e YOLO11

Fig 6. Deteção de barcos usando deteção OBB e YOLO11.

Link to this sectionEstimativa de pose e YOLO11: Acompanhamento de pontos-chave#

A estimativa de pose é uma técnica de visão computacional que segue pontos-chave, como articulações, membros ou outros marcadores, para compreender como um objeto se move. Em vez de tratar um objeto ou corpo inteiro como uma unidade completa, este método decompõe-no nas suas partes chave. Isto torna possível analisar movimentos, gestos e interações em detalhe.

Uma aplicação comum desta tecnologia é a estimativa de pose humana. Ao seguir as posições de várias partes do corpo em tempo real, fornece uma imagem clara de como uma pessoa se está a mover. Esta informação pode ser usada para diversos fins, desde o reconhecimento de gestos e monitorização de atividades até à análise de desempenho no desporto.

Da mesma forma, na reabilitação física, os terapeutas podem usar a estimativa de pose humana e o YOLO11 para monitorizar os movimentos dos pacientes durante os exercícios. Isto ajuda a garantir que cada movimento é feito corretamente enquanto se acompanha o progresso ao longo do tempo.

YOLO11 monitorando um exercício usando estimativa de pose

Fig 7. O YOLO11 pode monitorizar um treino usando estimativa de pose.

Link to this sectionExplorar como o YOLO11 suporta várias tarefas de visão computacional#

Agora que explorámos detalhadamente todas as tarefas de visão computacional suportadas pelo YOLO11, vamos ver como o YOLO11 as suporta.

O YOLO11 não é apenas um modelo - é um conjunto de variantes de modelos especializados, cada um concebido para uma tarefa específica de visão computacional. Isto faz do YOLO11 uma ferramenta versátil que pode ser adaptada a uma vasta gama de aplicações. Também podes ajustar estes modelos em datasets personalizados para enfrentar os desafios únicos dos teus projetos.

Aqui estão as variantes do modelo YOLO11 pré-treinadas para tarefas de visão específicas:

  • YOLO11: Este modelo deteta e rotula múltiplos objetos em tempo real, tornando-o ideal para reconhecimento visual de alta velocidade.
  • YOLO11-seg: Esta variante foca-se na segmentação usando máscaras detalhadas para separar objetos dos seus fundos.
  • YOLO11-obb: Este modelo foi concebido para detetar objetos rodados ao desenhar caixas delimitadoras que se alinham com a orientação de cada objeto.
  • YOLO11-cls: Esta variante classifica imagens atribuindo um único rótulo de categoria com base no conteúdo geral.
  • YOLO11-pose: Este modelo estima pontos-chave no corpo para seguir a postura, as posições dos membros e o movimento.

Cada variante está disponível em diferentes tamanhos, permitindo aos utilizadores escolher o equilíbrio certo entre velocidade e precisão para as suas necessidades específicas.

Link to this sectionPrincipais pontos#

As tarefas de visão computacional estão a mudar a forma como as máquinas compreendem e interagem com o mundo. Ao decompor imagens e vídeos em elementos chave, estas tecnologias facilitam a análise detalhada de objetos, movimentos e interações.

Desde a melhoria da segurança rodoviária e desempenho desportivo até à simplificação de processos industriais, modelos como o YOLO11 podem fornecer informações em tempo real que impulsionam a inovação. À medida que a Vision AI continua a evoluir, desempenhará provavelmente um papel cada vez mais importante na forma como interpretamos e utilizamos dados visuais todos os dias.

Junte-se à nossa comunidade e visite nosso repositório GitHub para ver a IA em ação. Explore nossas opções de licenciamento e descubra mais sobre IA na agricultura e visão computacional na manufatura em nossas páginas de soluções.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática