Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Incorporações (Embeddings)

Descubra como as incorporações conectam os dados humanos e a lógica das máquinas. Aprenda a gerar representações vetoriais para tarefas de IA usando Ultralytics e explore a Ultralytics .

As incorporações são representações vetoriais densas, de baixa dimensão e contínuas de variáveis discretas, servindo como um tradutor fundamental entre os dados humanos e a lógica da máquina. No domínio da Inteligência Artificial (IA), os computadores não conseguem compreender intuitivamente dados confusos e não estruturados, como texto, imagens ou áudio. Os embeddings resolvem isso convertendo essas entradas em listas de números reais, conhecidos como vetores, que existem num espaço matemático de alta dimensão. Ao contrário das codificações tradicionais, que podem simplesmente atribuir um ID aleatório a um objeto, os embeddings são aprendidos por meio de treinamento, garantindo que itens semanticamente semelhantes — como as palavras "rei" e "rainha" ou imagens de dois gatos diferentes — sejam posicionados próximos uns dos outros no espaço vetorial.

Como funcionam os Embeddings

A criação de uma incorporação envolve alimentar dados brutos numa rede neural projetada para extração de características. Durante o treinamento, o modelo aprende a comprimir as características essenciais da entrada numa forma numérica compacta. Por exemplo, um modelo de Visão Computacional (CV) que analisa uma fotografia não vê apenas pixels; ele mapeia formas, texturas e cores numa coordenada específica num gráfico multidimensional. Ao medir a similaridade, os sistemas calculam a distância entre essas coordenadas usando métricas como similaridade coseno ou distância euclidiana. Essa proximidade matemática permite que os algoritmos realizem tarefas complexas, como classificação e agrupamento, com alta eficiência.

Aplicações no Mundo Real

As incorporações atuam como o motor de muitos recursos inteligentes usados em produtos de software modernos.

  • Pesquisa semântica: Os motores de pesquisa tradicionais geralmente dependem da correspondência exata de palavras-chave, o que falha se um utilizador pesquisar «auto», mas o documento contiver «carro». As incorporações capturam o significado por trás das palavras. Ao representar a consulta de pesquisa e os documentos do banco de dados como vetores, o sistema pode recuperar resultados que correspondam à intenção do utilizador, mesmo que as palavras específicas sejam diferentes.
  • Sistemas de recomendação: Serviços de streaming e sites de comércio eletrónico utilizam incorporações para personalizar as experiências dos utilizadores. Se um utilizador assistir a um filme de ficção científica, o sistema identifica o vetor de incorporação desse filme e procura outros filmes com vetores semelhantes na base de dados. Isso permite sugestões precisas com base na semelhança de conteúdo, em vez de apenas tags ou categorias manuais .
  • Aprendizagem Zero-Shot: Modelos avançados utilizam incorporações conjuntas para ligar diferentes modalidades, como texto e imagens. Isso permite que um sistema reconheça objetos que nunca viu explicitamente durante o treinamento, associando a incorporação da imagem com a incorporação do texto do nome do objeto.

Gerando incorporações com Python

Modelos de última geração, como YOLO26 pode ser usado para gerar incorporações de imagens robustas de forma eficiente. O exemplo a seguir demonstra como extrair um vetor de características de uma imagem usando o ultralytics Pacote Python .

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

Incorporações vs. Conceitos Relacionados

Para implementar soluções de IA de forma eficaz, é útil distinguir embeddings de termos técnicos intimamente relacionados.

  • Embeddings vs. Pesquisa vetorial: O embedding é a própria representação dos dados (a lista de números). A pesquisa vetorial é o processo subsequente de consultar uma base de dados para encontrar os vizinhos mais próximos desse embedding. Ferramentas especializadas conhecidas como base de dados vetorial são frequentemente utilizadas para armazenar e pesquisar esses embeddings em escala.
  • Embeddings vs. Tokenização: No Processamento de Linguagem Natural (NLP), a tokenização é a etapa preliminar de dividir o texto em pedaços menores (tokens). Esses tokens são então mapeados para embeddings. Portanto, a tokenização prepara os dados, enquanto os embeddings representam o significado dos dados.
  • Embeddings vs. Deep Learning: Deep learning é o campo mais amplo do machine learning baseado em redes neurais. Embeddings são uma saída ou camada específica dentro de uma arquitetura de deep learning, servindo frequentemente como ponte entre entradas brutas e as camadas de tomada de decisão do modelo.

Os programadores que desejam gerir o ciclo de vida dos seus conjuntos de dados, incluindo anotação e treino de modelos para gerar incorporações personalizadas, podem utilizar a Ultralytics . Esta ferramenta abrangente simplifica o fluxo de trabalho, desde a gestão de dados até à implementação, garantindo que as incorporações que alimentam as suas aplicações são derivadas de dados de alta qualidade e bem selecionados. Quer utilize frameworks como PyTorch ou TensorFlow, dominar as incorporações é um passo crucial na construção de sistemas sofisticados de reconhecimento de padrões.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora