Interactive Segmentation
Aprende como a segmentação interativa usa prompts human-in-the-loop para isolar objetos. Descobre como usar o Ultralytics YOLO26 e a Plataforma Ultralytics para tarefas.
A segmentação interativa é uma abordagem altamente colaborativa de visão computacional na qual um usuário humano fornece entrada contínua ou de disparo único — como cliques, caixas delimitadoras (bounding boxes) ou prompts de texto — para guiar um modelo de IA no isolamento de objetos específicos dentro de uma imagem. Diferente de métodos totalmente automatizados, esta técnica de "humano no circuito" (human-in-the-loop) permite que os usuários definam exatamente o que precisa ser segmentado, tornando-a especialmente valiosa ao lidar com dados visuais ambíguos, objetos sobrepostos ou classes não vistas. Nos últimos anos, a introdução de modelos fundamentais melhorou drasticamente a velocidade e a precisão deste processo, transformando-o em uma ferramenta vital para anotação de dados e imagens de precisão.
Link to this sectionComo a Segmentação Interativa Funciona#
Em sua essência, o fluxo de trabalho baseia-se na segmentação de conceito por prompt, onde o modelo interpreta a orientação do usuário para gerar uma máscara perfeita em nível de pixel. Um usuário pode colocar um clique "positivo" no objeto em primeiro plano que deseja selecionar e um clique "negativo" nas áreas de fundo que deseja excluir. Modelos avançados como o Segment Anything Model (SAM) e seus sucessores, Meta SAM 3, levam isso adiante ao aceitar diversos tipos de gestos [1], caixas delimitadoras e até mesmo descrições de texto para fundamentar a busca visual. O modelo calcula o limite ideal com base nestes prompts, e o usuário pode refinar iterativamente a máscara com cliques adicionais até que a precisão desejada seja alcançada.
Link to this sectionAplicações no Mundo Real#
A segmentação interativa está transformando fluxos de trabalho em diversos setores ao combinar a experiência humana com a eficiência da IA.
- Imagiologia Médica: Em IA na saúde, médicos e radiologistas usam ferramentas interativas para isolar tumores, lesões ou órgãos específicos em ressonâncias magnéticas e tomografias computadorizadas. Pesquisas sobre modelagem espacial para imagens médicas [2] mostram que cliques interativos permitem que profissionais médicos corrijam rapidamente as previsões da IA, garantindo a precisão rigorosa necessária para o diagnóstico do paciente.
- Mapeamento Geoespacial e por Satélite: Planejadores urbanos e cientistas ambientais usam modelos interativos para acelerar a extração de recursos GIS [3]. Em vez de traçar manualmente linhas costeiras complexas, limites agrícolas ou novas infraestruturas, os analistas podem dar alguns cliques estratégicos para gerar instantaneamente polígonos geográficos precisos.
- Detecção de Defeitos Industriais: Para IA na manufatura, engenheiros de controle de qualidade podem usar prompts interativos para destacar falhas microscópicas em linhas de produção, adaptando dinamicamente o sistema a novos tipos de defeitos sem precisar treinar novamente todo o modelo.
Link to this sectionSegmentação Interativa vs. Segmentação de Instância#
Embora ambos os conceitos envolvam separar objetos no nível de pixel, eles servem a propósitos operacionais diferentes. A segmentação de instância é normalmente um processo totalmente automatizado onde um modelo, como o Ultralytics YOLO26, detecta e descreve classes predefinidas (ex.: "carro", "pessoa", "cachorro") sem a intervenção do usuário. Você pode aprender mais sobre como isso funciona em nosso guia de segmentação de instância.
Por outro lado, a segmentação interativa não depende estritamente de classes predefinidas. Ela é agnóstica em relação à classe, o que significa que ela segmenta o que o usuário apontar, tornando-a uma excelente opção para pipelines de aprendizado ativo onde objetos novos precisam ser rapidamente anotados e adicionados a datasets personalizados usando ferramentas como a Ultralytics Platform.
Link to this sectionExemplo usando Ultralytics#
Você pode implementar facilmente a segmentação interativa em seus próprios projetos usando PyTorch e o pacote ultralytics do Python. Neste exemplo, usamos o FastSAM para segmentar um objeto específico fornecendo um prompt de caixa delimitadora.
from ultralytics import FastSAM
# Load a pretrained FastSAM model
model = FastSAM("FastSAM-s.pt")
# Perform interactive segmentation using a bounding box prompt [x1, y1, x2, y2]
results = model("path/to/image.jpg", bboxes=[100, 100, 300, 300])
# Display the segmented result on screen
results[0].show()Este trecho demonstra como um simples prompt espacial guia diretamente o modelo para isolar a região de interesse, simplificando tarefas complexas de segmentação de imagem com o mínimo de código.






