Glossário

Classificação de Imagens

Descubra a classificação de imagens com o Ultralytics YOLO: treine modelos personalizados para cuidados de saúde, agricultura, retalho e muito mais, utilizando ferramentas de ponta.

A classificação de imagens é uma tarefa fundamental na visão computacional (CV) que envolve a atribuição de uma uma única etiqueta ou categoria a uma imagem digital inteira com base no seu conteúdo visual. Este processo permite às máquinas "ver" e interpretar o mundo através do reconhecimento de padrões, objectos ou cenas nos dados visuais. Como um componente componente central da inteligência artificial (IA), serve de como o bloco de construção para sistemas de reconhecimento visual mais complexos, permitindo aos sistemas automatizados categorizar de informação visual de forma eficiente.

Como funciona a classificação de imagens

A nível técnico, a classificação de imagens baseia-se em algoritmos de aprendizagem automática (ML), nomeadamente modelos de aprendizagem profunda (DL) conhecidos como Redes Neuronais Convolucionais (CNN). Estas redes são concebidas para processar dados de píxeis e efetuar automaticamente extração de caraterísticas, identificando atributos de baixo nível identificando atributos de baixo nível, como arestas e texturas nas camadas iniciais e formas complexas nas camadas mais profundas.

O processo segue normalmente uma abordagem de aprendizagem supervisionada:

Treino: O modelo é alimentado com um conjunto de dados rotulados, tais como ImageNetque contém milhares ou milhões de imagens com categorias conhecidas.
Aprender: Através da aprendizagem: Através da retropropagação, a rede ajusta os seus modelos internos para minimizar os erros de previsão.
Inferência: Uma vez treinado, o modelo pode analisar imagens novas e inéditas e produzir uma pontuação de probabilidade para cada classe utilizando uma função softmax. A categoria com a maior probabilidade é atribuída como etiqueta final.

Estruturas populares como PyTorch e TensorFlow fornecem as ferramentas necessárias para construir e treinar estas arquitecturas sofisticadas.

Diferenciação entre classificação e tarefas relacionadas

Embora a classificação de imagens responda à pergunta "O que está nesta imagem?", é frequentemente confundida com outras tarefas de visão computacional. tarefas de visão por computador. Compreender as distinções é crucial para selecionar a ferramenta certa para um projeto:

Deteção de objectos: Ao contrário da classificação, que rotula toda a imagem, a deteção de objectos identifica onde os objectos estão localizados. Desenha uma caixa delimitadora à volta de cada objeto e classifica-os individualmente.
Segmentação de imagens: Oferece precisão ao nível do pixel. A segmentação semântica classifica cada classifica cada pixel numa categoria (por exemplo, estrada vs. céu), enquanto a segmentação de instância distingue entre objectos individuais da mesma classe.

Aplicações no Mundo Real

A classificação de imagens é omnipresente em todos os sectores, impulsionando a automatização e melhorando os processos de tomada de decisão.

1. Imagiologia médica e cuidados de saúde

No domínio da análise de imagens médicas, os modelos de classificação ajudam os radiologistas a efetuar uma pré-seleção dos exames. Por exemplo, os algoritmos podem classify as radiografias de tórax ou ou RMN como "normais" ou "anormais", assinalando potenciais problemas como pneumonia ou tumores para revisão prioritária. A investigação efectuada pelos Institutos Nacionais de Saúde (NIH) demonstra como a IA ajuda no diagnóstico precoce de doenças, melhorando significativamente os resultados dos doentes. Pode ler mais sobre o nosso trabalho em deteção de tumores utilizando YOLO11.

2. Agricultura inteligente

A agricultura de precisão utiliza a classificação de imagens para monitorizar o estado das culturas. Os drones equipados com câmaras captam imagens dos campos, que são depois analisadas para classify as plantas como saudáveis, deficientes em nutrientes ou doentes. Isto permite intervenção direcionada, reduzindo a utilização de produtos químicos e aumentando o rendimento. O Departamento de Agricultura dos Estados Unidos (USDA) destaca como essas tecnologias promovem práticas agrícolas sustentáveis. Saiba como Ultralytics apoia a IA na agricultura para revolucionar a agricultura moderna agricultura moderna.

Implementação da classificação com o YOLO11

Embora famoso pela deteção, o Ultralytics YOLO11 também é altamente eficiente para tarefas de tarefas de classificação de imagens. Oferece um equilíbrio entre velocidade e precisão, tornando-a adequada para aplicações em tempo real.

Aqui está um exemplo conciso de como usar um modelo YOLO11 pré-treinado para classify uma imagem usando o ultralytics Pacote Python :

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on an external image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")

Para os utilizadores que pretendem criar as suas próprias soluções, é possível treinar modelos personalizados em conjuntos de dados específicos utilizando a mesma API. Quer esteja a implementar em dispositivos periféricos utilizando ferramentas como OpenCV ou a aumentar a escala com a infraestrutura de nuvem, os modelos de classificação modernos fornecem a versatilidade necessária para diversos cenários de implantação cenários.

Classificação de Imagens

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como funciona a classificação de imagens

Diferenciação entre classificação e tarefas relacionadas

Aplicações no Mundo Real

1. Imagiologia médica e cuidados de saúde

2. Agricultura inteligente

Implementação da classificação com o YOLO11

Leia mais nesta categoria

Compreender por que a anotação humana no ciclo é fundamental

O que é destilação de conjuntos de dados? Uma rápida visão geral

Os óculos Oakley Meta AI estão a redefinir os óculos com a Vision AI

Junte-se à comunidade Ultralytics