Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Guias

Uma olhada na solução de busca semântica de imagens da Ultralytics

Aprende como a solução de pesquisa semântica de imagens da Ultralytics pode ser usada para combinar rapidamente imagens com consultas, tornando os fluxos de trabalho criativos e de pesquisa mais eficientes.

ABAbirami Vina
5 min read
Busca semântica de imagens da Ultralytics combinando imagens com consultas em linguagem natural

Percorrer uma galeria com centenas de imagens pode rapidamente se tornar exaustivo, especialmente quando você está tentando encontrar algo muito específico. Por exemplo, alguém que procura um mapa da Roma antiga pode encontrar mapas de cidades aleatórios ou fotos de viagem em vez disso.

Esses cenários ocorrem porque a maioria dos sistemas de busca de imagens depende de nomes de arquivos ou tags. Embora isso possa funcionar para consultas gerais, muitas vezes é insuficiente quando precisão, detalhes e contexto são necessários.

Na verdade, muitas pessoas em áreas como design, marketing e pesquisa têm dificuldade em encontrar as imagens certas, já que buscas por palavras-chave raramente capturam a ideia específica que estão procurando. Isso pode causar atrasos e prejudicar a produtividade.

No entanto, graças aos recentes avanços em inteligência artificial (IA), as limitações tradicionais das ferramentas de busca de imagens estão sendo substituídas por sistemas mais inteligentes e intuitivos. Por exemplo, computer vision, um ramo da IA que se concentra em interpretar e compreender dados visuais, está permitindo buscas de imagens mais rápidas e precisas ao analisar o conteúdo real das imagens.

Em particular, a semantic image search vai além de combinar palavras-chave, compreendendo o significado por trás de uma busca. Ela permite que você use linguagem natural para descrever o que está procurando e encontra imagens que correspondem à ideia, não apenas às tags. Por exemplo, uma busca por "animais em um zoológico" pode retornar imagens aleatórias de animais em um sistema tradicional, enquanto uma busca semântica compreende o contexto e encontra imagens de animais em ambientes de zoológico.

Usando a pesquisa semântica de imagens para recuperar imagens de animais em um zoológico

Fig 1. Um exemplo de uso da busca semântica de imagens para recuperar imagens de animais em um zoológico.

Neste artigo, vamos explorar como a busca semântica de imagens funciona e discutir alguns casos de uso do mundo real. Também daremos uma olhada na solução de busca semântica de imagens da Ultralytics, que facilita a aplicação desse conceito em projetos do dia a dia. Vamos começar!

Link to this sectionUma visão geral da solução de busca semântica de imagens da Ultralytics#

O pacote Python da Ultralytics oferece uma variedade de soluções prontas para uso em aplicações comuns de computer vision, incluindo gerenciamento de filas, contagem de objetos baseada em região, cálculo de distância e busca semântica de imagens. Essas soluções são projetadas para serem fáceis de usar, mesmo para aqueles sem experiência em IA ou computer vision.

Entre elas, a solução de busca semântica de imagens permite que os usuários encontrem imagens relevantes usando descrições em linguagem natural em vez de depender de nomes de arquivos ou tags manuais. Ela compreende o significado por trás de uma consulta de busca e retorna imagens que correspondem à ideia, tornando-a especialmente útil quando precisão e contexto são importantes.

Link to this sectionComo funciona a solução de busca semântica de imagens#

A solução de busca semântica de imagens da Ultralytics é alimentada por dois modelos avançados de IA: o CLIP (Contrastive Language - Image Pre-Training) da OpenAI e o FAISS (Facebook AI Similarity Search) da Meta. O CLIP converte tanto texto quanto imagens em representações numéricas chamadas embeddings, que capturam seu significado e contexto. O FAISS busca eficientemente entre milhões desses embeddings para encontrar os mais relevantes para sua consulta.

Além disso, uma interface web simplificada, criada com Flask, torna a solução fácil de usar. Os usuários podem inserir consultas em linguagem natural e recuperar imagens correspondentes sem qualquer rotulagem manual ou preparação de dados.

Uma das principais vantagens desta solução é sua capacidade zero-shot. Isso significa que ela pode interpretar e responder a consultas sobre objetos ou cenas nos quais não foi especificamente treinada. Ao aproveitar seu amplo entendimento de linguagem e recursos visuais, ela pode retornar resultados relevantes mesmo para conteúdo desconhecido ou não marcado.

Por exemplo, se você usar a solução para buscar por um “ambiente de escritório”, ela pode retornar imagens de mesas, salas de reunião ou áreas de trabalho, mesmo que essas palavras não estejam vinculadas aos arquivos. Isso torna a busca semântica de imagens da Ultralytics uma ferramenta prática e flexível para projetos criativos, pesquisas e trabalho com grandes bibliotecas de imagens.

Consultando imagens de um ambiente de escritório usando a pesquisa semântica de imagens

Fig 2. Consultando imagens de um ambiente de escritório usando a solução de busca semântica de imagens da Ultralytics.

Link to this sectionAplicações reais da solução de busca semântica de imagens#

Agora que temos uma melhor compreensão da solução de busca semântica de imagens da Ultralytics, vamos percorrer algumas aplicações do mundo real e ver como diferentes setores podem integrá-la em seus fluxos de trabalho visuais.

Link to this sectionUsando ferramentas de busca de imagens impulsionadas por IA para gerenciamento de datasets#

Gerenciar grandes datasets de imagens é uma das tarefas que mais consomem tempo na construção de soluções de computer vision. Na maioria dos casos, os desenvolvedores não precisam de todo o dataset. Em vez disso, podem estar procurando por tipos específicos de imagens para treinar modelos ou criar conjuntos de validação limpos. Mas encontrar exatamente essas imagens entre milhares pode ser complicado.

Digamos que você esteja trabalhando em um projeto envolvendo imagens de equitação. Você pode precisar apenas de fotos onde o cavaleiro está usando capacete, andando com outros, ou capturado em meio ao movimento visto de lado. Sem tags adequadas, encontrar essas imagens manualmente pode levar muito tempo e esforço.

A solução de busca semântica de imagens, suportada pela Ultralytics, pode resolver esse problema permitindo que desenvolvedores usem consultas em linguagem natural para encontrar rapidamente o que precisam, mesmo em datasets confusos ou sem tags. Isso reduz o tempo gasto com classificação e permite que as equipes se concentrem na construção de modelos melhores de forma mais eficiente.

Pesquisando imagens específicas em grandes conjuntos de dados facilmente

Fig 3. Você pode buscar facilmente por imagens específicas em grandes datasets.

Link to this sectionBusca zero-shot de imagens para produtos de e-commerce#

Buscar por produtos específicos online pode ser frustrante. Os compradores frequentemente descrevem o que procuram com suas próprias palavras, mas as listagens de produtos podem usar termos ou tags diferentes. Essa incompatibilidade torna mais difícil encontrar os itens certos, especialmente em grandes catálogos.

Considere uma situação em que alguém está comprando móveis e busca por um “conjunto de sofá, cadeira e mesa”. O produto que procura pode estar listado sob um rótulo diferente, como um “conjunto de sala de estar de três peças”. Como os termos não coincidem exatamente, o item pode não aparecer nos resultados da busca, mesmo sendo exatamente o que o cliente precisa.

Pesquisa semântica de imagens combinando a intenção do usuário com visuais de produtos relevantes

Fig 4. A solução de busca semântica de imagens da Ultralytics ajuda a combinar a intenção do usuário com visuais de produtos relevantes.

Link to this sectionIndexação avançada de imagens para mídia e publicação#

Da mesma forma, em áreas como jornalismo, blogs e marketing digital, recursos visuais são essenciais para contar histórias. A imagem certa pode apoiar uma mensagem, definir o tom e manter os leitores engajados. No entanto, encontrar essa imagem perfeita muitas vezes significa procurar entre muitos arquivos.

Um bom exemplo é um blogueiro escrevendo sobre tendências de decoração. Ele pode querer uma imagem de uma sala de estar minimalista e brilhante com luz natural. No entanto, se as imagens disponíveis estiverem marcadas apenas com termos genéricos como “quarto” ou “interior”, encontrar a correspondência certa pode ser frustrante.

Com a busca semântica de imagens, ele pode simplesmente digitar uma frase descritiva como “uma sala de estar minimalista brilhante com janelas grandes” e recuperar instantaneamente imagens que correspondem à ideia. Não há necessidade de depender de tags exatas ou nomes de arquivos.

Equipes de conteúdo usando a pesquisa semântica de imagens para otimizar a seleção de imagens

Fig 5. Equipes de conteúdo podem usar a solução de busca semântica de imagens da Ultralytics para otimizar a seleção de imagens.

Link to this sectionBusca semântica de imagens para inspiração em arte e design#

Normalmente, trabalhos criativos como projetar um painel de inspiração (mood board) ou reunir referências para um novo projeto envolvem a busca em grandes coleções de imagens para encontrar visuais que combinem com um estilo ou ideia específica. Um exemplo interessante são os designers trabalhando em um cenário para um filme. Eles podem precisar capturar um humor, época ou atmosfera específica. Isso pode variar de uma cidade futurista a uma sala de estar aconchegante com estilo dos anos 1980.

A busca semântica de imagens da Ultralytics torna isso mais fácil ao conectar a linguagem ao significado visual. Isso possibilita que as equipes explorem ideias rapidamente e permaneçam focadas, sem serem atrasadas por buscas manuais.

Pesquisa semântica de imagens apoiando a exploração visual mais rápida para projetos criativos

Fig 6. A solução de busca semântica de imagens da Ultralytics apoia uma exploração visual mais rápida para projetos criativos.

Link to this sectionPrós e contras da busca de imagens impulsionada por IA#

Aqui estão algumas das principais vantagens de usar a busca de imagens impulsionada por IA para melhorar fluxos de trabalho visuais e a eficiência da busca:

  • Suporte a linguagem natural: As pessoas podem encontrar imagens descrevendo-as com suas próprias palavras, sem usar tags predefinidas.
  • Suporte para formatos de imagem comuns: Esses sistemas normalmente funcionam com formatos padrão como JPG e PNG, portanto, não há necessidade de converter ou reformatar arquivos.
  • Integra-se com outras ferramentas: A busca de imagens impulsionada por IA pode ser frequentemente incorporada em pipelines maiores, painéis ou softwares criativos.

Embora as soluções de busca de imagens impulsionadas por IA ofereçam muitos benefícios, há também algumas limitações a serem lembradas. Aqui estão alguns fatores a serem considerados:

  • Precisão limitada com consultas de nicho: Se uma consulta for muito específica ou incomum, o sistema pode retornar resultados menos relevantes devido a lacunas nos dados de treinamento do modelo.
  • Viés nos dados de treinamento: Modelos de IA podem refletir os vieses presentes nos datasets em que foram treinados, o que pode levar a resultados distorcidos ou incompletos.
  • O desempenho depende da qualidade da imagem: Imagens de baixa resolução ou pouco claras podem reduzir a eficácia da geração de embeddings e a precisão da busca.

Link to this sectionPrincipais pontos#

A busca semântica de imagens desloca o foco da combinação de palavras-chave para a compreensão do significado, ajudando os usuários a encontrar imagens com base no contexto, e não apenas em tags ou nomes de arquivos. Isso torna a experiência de busca mais rápida, precisa e melhor alinhada com o que os usuários estão realmente procurando.

Para equipes criativas e setores orientados a conteúdo, isso significa menos tempo gasto classificando arquivos irrelevantes e mais tempo desenvolvendo ideias. Organizações que gerenciam grandes volumes de dados visuais podem usar soluções como a busca semântica de imagens da Ultralytics para otimizar a descoberta de conteúdo, reduzir a classificação manual e tomar decisões mais inteligentes e rápidas baseadas no contexto visual.

Faça parte da nossa comunidade e explore nosso repositório no GitHub para obter mais insights sobre IA. Dê uma olhada em nossas páginas de soluções para saber mais sobre inovações como IA em logística e computer vision em saúde. Confira nossas opções de licenciamento e comece hoje mesmo!

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática