Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Zero-Shot Learning

Explora o Zero-Shot Learning (ZSL) para detetar e classificar objetos sem dados de treino. Aprende como o Ultralytics YOLO-World permite a deteção de vocabulário aberto em tempo real.

Zero-Shot Learning (ZSL) é um paradigma de machine learning que permite que modelos de inteligência artificial reconheçam, classifiquem ou detectem objetos que nunca encontraram durante a fase de treinamento. No supervised learning tradicional, um modelo requer milhares de exemplos rotulados para cada categoria específica que precisa identificar. O ZSL elimina essa dependência estrita ao aproveitar informações auxiliares — geralmente descrições de texto, atributos semânticos ou embeddings — para preencher a lacuna entre classes vistas e não vistas. Essa capacidade permite que sistemas de artificial intelligence (AI) sejam significativamente mais flexíveis, escaláveis e capazes de lidar com ambientes dinâmicos onde coletar dados exaustivos para cada objeto possível é impraticável.

Link to this sectionComo funciona o Zero-Shot Learning#

O mecanismo central do ZSL envolve a transferência de conhecimento de conceitos familiares para conceitos desconhecidos usando um espaço semântico compartilhado. Em vez de aprender a reconhecer uma "zebra" apenas memorizando padrões de pixels de listras pretas e brancas, o modelo aprende a relação entre características visuais e atributos semânticos (por exemplo, "forma de cavalo", "padrão listrado", "quatro pernas") derivados de natural language processing (NLP).

Esse processo depende frequentemente de multi-modal models que alinham representações de imagem e texto. Por exemplo, pesquisas fundamentais como o OpenAI's CLIP demonstram como modelos podem aprender conceitos visuais a partir de supervisão em linguagem natural. Quando um modelo ZSL encontra um objeto não visto, ele extrai as características visuais e as compara com um dicionário de vetores semânticos. Se as características visuais se alinham com a descrição semântica da nova classe, o modelo pode classificá-la corretamente, realizando efetivamente uma previsão "zero-shot". Essa abordagem é fundamental para foundation models modernos que generalizam através de uma vasta gama de tarefas.

Link to this sectionAplicações no Mundo Real#

O Zero-Shot Learning está impulsionando a inovação em vários setores ao permitir que sistemas generalizem além de seus dados iniciais de treinamento.

  1. Detecção de objetos de vocabulário aberto (Open-Vocabulary Object Detection): Arquiteturas modernas como o YOLO-World utilizam o ZSL para detectar objetos com base em prompts de texto definidos pelo usuário. Isso permite a object detection em cenários onde definir uma lista fixa de classes de antemão é impossível, como ao procurar itens específicos em vastos arquivos de vídeo. Pesquisadores do Google Research continuam a ampliar os limites dessas capacidades de vocabulário aberto.

  2. Diagnósticos médicos: Em AI in healthcare, obter dados rotulados para doenças raras é frequentemente difícil e caro. Modelos ZSL podem ser treinados em condições comuns e descrições de sintomas raros da literatura médica encontrados em bancos de dados como o PubMed, permitindo que o sistema sinalize potenciais anomalias raras em imagens médicas sem exigir um conjunto de dados massivo de casos positivos.

  3. Conservação da vida selvagem: Para AI in agriculture e ecologia, identificar espécies ameaçadas que são raramente fotografadas é crítico. O ZSL permite que conservacionistas detectem esses animais usando descrições baseadas em atributos definidas em bancos de dados biológicos como a Encyclopedia of Life.

Link to this sectionDetecção Zero-Shot com Ultralytics#

O modelo Ultralytics YOLO-World exemplifica o Zero-Shot Learning em ação. Ele permite que usuários definam classes personalizadas dinamicamente em tempo de execução sem retreinar o modelo. Isso é alcançado conectando um backbone de detecção robusto com um codificador de texto que compreende linguagem natural.

O exemplo em Python a seguir demonstra como usar o YOLO-World para detectar objetos que não faziam parte explicitamente de um conjunto de treinamento padrão usando o pacote ultralytics.

from ultralytics import YOLOWorld

# Load a pre-trained YOLO-World model capable of Zero-Shot Learning
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes via text prompts (e.g., specific accessories)
# The model adjusts to detect these new classes without retraining
model.set_classes(["blue backpack", "red apple", "sunglasses"])

# Run inference on an image to detect the new zero-shot classes
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Link to this sectionDistinção de conceitos relacionados#

Para entender completamente o ZSL, é útil distingui-lo de estratégias de aprendizado semelhantes usadas em computer vision (CV):

  • Few-Shot Learning (FSL): Enquanto o ZSL não requer nenhum exemplo da classe alvo, o FSL fornece ao modelo um conjunto de suporte muito pequeno (tipicamente de 1 a 5 exemplos) para adaptação. O ZSL é geralmente considerado mais desafiador, pois depende inteiramente de inferência semântica em vez de exemplos visuais.
  • One-Shot Learning: Um subconjunto do FSL onde o modelo aprende a partir de exatamente um exemplo rotulado. O ZSL difere fundamentalmente porque opera sem nem mesmo uma única imagem da nova categoria.
  • Transfer Learning: Este termo amplo refere-se à transferência de conhecimento de uma tarefa para outra. O ZSL é um tipo específico de transfer learning que usa atributos semânticos para transferir conhecimento para classes não vistas sem a necessidade de fine-tuning tradicional em novos dados.

Link to this sectionDesafios e Perspectivas Futuras#

Embora o ZSL ofereça um potencial imenso, ele enfrenta desafios como o problema de mudança de domínio (domain shift problem), onde os atributos semânticos aprendidos durante o treinamento não mapeiam perfeitamente para a aparência visual de classes não vistas. Além disso, modelos ZSL podem sofrer de viés, onde a precisão da predição é significativamente maior para classes vistas em comparação com as não vistas.

Pesquisas de organizações como o Stanford University's AI Lab e a IEEE Computer Society continuam a abordar essas limitações. À medida que computer vision tools se tornam mais robustas, espera-se que o ZSL se torne um recurso padrão, reduzindo a dependência de esforços massivos de data labeling. Para equipes que buscam gerenciar conjuntos de dados de forma eficiente antes de implantar modelos avançados, a Ultralytics Platform oferece ferramentas abrangentes para anotação e gerenciamento de datasets.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática