Glossário

Detectores de Objetos de Dois Estágios

Descubra o poder dos detectores de objetos de dois estágios: soluções focadas na precisão para detecção precisa de objetos em tarefas complexas de visão computacional.

Os detectores de objectos em duas fases são uma classe de modelos sofisticados de modelos de aprendizagem profunda sofisticados concebidos para identificar e identificar e localizar objectos em imagens com elevada precisão. Ao contrário dos seus homólogos mais rápidos, estas arquitecturas dividem a tarefa de deteção de objectos em duas fases distintas: identificar potenciais regiões onde possam existir objectos e, em seguida, classificar essas regiões enquanto refinam as suas coordenadas. Esta abordagem de processo dividido fez com que, historicamente, os detectores de duas fases fossem o padrão de ouro para tarefas em que a precisão é fundamental, muitas vezes à custa da velocidade e dos recursos computacionais.

O fluxo de trabalho em duas fases

A arquitetura de um detetor de duas fases funciona como um funil, restringindo os dados de uma imagem ampla a objectos específicos, objectos específicos e classificados. Este processo envolve normalmente uma rede de base, como a ResNet, para extrair caraterísticas, seguida das duas fases críticas:

Proposta de região: A primeira fase utiliza uma componente frequentemente designada por Rede de Proposta de Região (RPN). Esta rede analisa os mapas de caraterísticas gerados pelo backbone para identificar "Regiões de Interesse" (RoIs). Nesta altura, o modelo não categoriza o objeto. objeto; actua essencialmente como um filtro de fundo, assinalando áreas que provavelmente contêm algo versus áreas que estão vazias. Este conceito foi solidificado no artigo de investigação seminal Faster R-CNN.
Classificação e refinamento: Na segunda fase, as regiões propostas são agrupadas num tamanho fixo tamanho fixo e introduzidas numa cabeça de deteção específica. Esta Esta cabeça executa duas tarefas simultâneas: atribui uma etiqueta de classe específica (por exemplo, "pessoa" "veículo") ao objeto e utiliza a regressão da caixa delimitadora para ajustar as coordenadas, assegurando que a caixa se ajusta firmemente ao objeto.

Detectores de dois estágios vs. de um estágio

Compreender a diferença entre detectores de objectos de duas fases e detectores de objectos de uma fase é fundamental para escolher o modelo correto para uma aplicação.

Detectores de duas fases (por exemplo, Faster R-CNN, Mask R-CNN): Estes modelos dão prioridade à precisão. Ao separando a proposta e a classificação, eles lidam muito bem com cenas complexas com objectos sobrepostos ou pequenos detalhes. detalhes. No entanto, este mecanismo de dupla verificação introduz uma maior latência de inferência, tornando-os difíceis de difícil de implementar em ambientes que exigem respostas imediatas.
Detectores de uma fase (por exemplo, YOLO, SSD): Arquitecturas como a Ultralytics YOLO tratam a deteção como um único problema de regressão regressão. Mapeiam os píxeis da imagem diretamente para coordenadas da caixa delimitadora e probabilidades de classe numa única passagem. Embora historicamente menos exactos do que os modelos de duas fases, as iterações modernas como YOLO11 fecharam efetivamente a lacuna de precisão, mantendo mantendo a velocidade de inferência em tempo real.

Arquitecturas chave na história

Várias arquitecturas definiram a evolução da deteção em duas fases:

R-CNN (redes neurais convolucionais baseadas em regiões): O pioneiro desta família, que utilizava a pesquisa selectiva para propor regiões antes de as alimentar numa Rede Neural Convolucional (CNN).
R-CNN rápido: Melhorado em relação ao original, partilhando partilhando a computação em toda a imagem, aumentando significativamente a eficiência do treino.
Máscara R-CNN: Uma extensão do Faster R-CNN que adiciona um ramo para prever máscaras de segmentação, permitindo segmentação de instâncias juntamente com a deteção padrão.

Aplicações no Mundo Real

Como os detectores de duas fases são excelentes na localização de pequenos objectos e na minimização de falsos positivos, continuam a ser vitais em sectores específicos.

Análise de imagens médicas: Em radiologia, a identificação de pequenos nódulos ou tumores em tomografias computorizadas exige a maior sensibilidade possível. Os modelos de duas fases são frequentemente utilizados aqui para minimizar o risco de falhar um diagnóstico crítico, tal como descrito em vários estudos sobre a IA nos cuidados de saúde.
Inspeção automatizada da qualidade: No fabrico, a identificação de defeitos microscópicos em placas de circuitos ou peças maquinadas requer uma análise de alta resolução de alta resolução. As capacidades de localização precisa dos detectores de duas fases ajudam a detetar falhas que podem passar despercebidas por modelos mais rápidos e menos granulares.

Implementação da deteção de alta precisão

Embora Ultralytics seja especializada em modelos de uma fase de última geração, as versões modernas como o YOLO11 oferecem a elevada precisão tipicamente associada aos detectores de duas fases, mas com uma treinamento e inferência de modelos significativamente mais rápidos.

Aqui está como implementar um modelo YOLO11 pré-treinado usando o ultralytics para obter resultados de deteção de alta precisão:

from ultralytics import YOLO

# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results with bounding boxes
results[0].show()

Conceitos Relacionados

Caixas de ancoragem: Formas de caixa predefinidas utilizadas por muitos detectores de duas fases para estimar o tamanho do objeto e a relação de aspeto durante a fase de proposta.
Supressão não máxima (NMS): Uma técnica de pós-processamento utilizada em detectores de uma e duas fases para eliminar caixas redundantes sobrepostas, assegurando que apenas a deteção mais segura permanece.
Intersecção sobre a União (IoU): Uma métrica utilizada para medir a sobreposição entre a caixa prevista e a verdade terrestre, essencial para treinar as cabeças de RPN e cabeças de refinamento.

Detectores de Objetos de Dois Estágios

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

O fluxo de trabalho em duas fases

Detectores de dois estágios vs. de um estágio

Arquitecturas chave na história

Aplicações no Mundo Real

Implementação da deteção de alta precisão

Conceitos Relacionados

Leia mais nesta categoria

Compreender por que a anotação humana no ciclo é fundamental

O que é destilação de conjuntos de dados? Uma rápida visão geral

Os óculos Oakley Meta AI estão a redefinir os óculos com a Vision AI

Junte-se à comunidade Ultralytics