Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Un aperçu de la solution de recherche d'images sémantiques d'Ultralytics

Abirami Vina

5 min de lecture

23 juin 2025

Découvrez comment la solution de recherche d'images sémantiques d'Ultralytics peut être utilisée pour faire correspondre rapidement des images avec des requêtes, ce qui rend les flux de travail créatifs et de recherche plus efficaces.

Parcourir une galerie de centaines d'images peut rapidement devenir accablant, surtout lorsque vous essayez de trouver quelque chose de très spécifique. Par exemple, une personne recherchant une carte de la Rome antique pourrait trouver des cartes de villes aléatoires ou des photos de voyage à la place.

Ces scénarios se produisent parce que la plupart des systèmes de recherche d'images reposent sur les noms de fichiers ou les balises. Bien que cela puisse fonctionner pour les requêtes générales, cela s'avère souvent insuffisant lorsque la précision, le détail et le contexte sont nécessaires. 

En réalité, de nombreuses personnes dans des domaines tels que le design, le marketing et la recherche ont du mal à trouver les bonnes images, car les recherches par mots-clés capturent rarement l'idée spécifique qu'elles recherchent. Cela peut entraîner des retards et perturber la productivité.

Cependant, grâce aux récents progrès de l'intelligence artificielle (IA), les limitations traditionnelles des outils de recherche d'images sont remplacées par des systèmes plus intelligents et plus intuitifs. Par exemple, la vision par ordinateur, une branche de l'IA qui se concentre sur l'interprétation et la compréhension des données visuelles, permet des recherches d'images plus rapides et plus précises en analysant le contenu réel des images.

En particulier, la recherche d'images sémantique va au-delà de la simple correspondance de mots-clés en comprenant le sens d'une recherche. Elle vous permet d'utiliser le langage naturel pour décrire ce que vous recherchez et trouve des images qui correspondent à l'idée, et pas seulement aux balises. Par exemple, une recherche de "animaux dans un zoo" pourrait renvoyer des images d'animaux aléatoires dans un système traditionnel, tandis qu'une recherche sémantique comprend le contexte et trouve des images d'animaux dans des environnements de zoo.

Fig. 1. Exemple d'utilisation de la recherche sémantique d'images pour récupérer des images d'animaux dans un zoo.

Dans cet article, nous allons explorer le fonctionnement de la recherche d'images sémantique et examiner quelques cas d'utilisation concrets. Nous examinerons également la solution de recherche d'images sémantique d'Ultralytics, qui facilite l'application de ce concept dans les projets quotidiens. Commençons !

Aperçu de la solution de recherche sémantique d'images d'Ultralytics

Le package Python Ultralytics offre une gamme de solutions prêtes à l'emploi pour les applications courantes de vision par ordinateur, notamment la gestion des files d'attente, le comptage d'objets basé sur les régions, le calcul des distances et la recherche d'images sémantiques. Ces solutions sont conçues pour être faciles à utiliser, même pour ceux qui n'ont pas d'expertise en IA ou en vision par ordinateur.

Parmi celles-ci, la solution de recherche d'images sémantique permet aux utilisateurs de trouver des images pertinentes en utilisant des descriptions en langage naturel au lieu de se fier aux noms de fichiers ou aux balises manuelles. Elle comprend le sens d'une requête de recherche et renvoie des images qui correspondent à l'idée, ce qui la rend particulièrement utile lorsque la précision et le contexte sont importants.

Fonctionnement de la solution de recherche d'images sémantique

La solution de recherche d'images sémantique d'Ultralytics est alimentée par deux modèles d'IA avancés : CLIP (Contrastive Language - Image Pre-Training) d'OpenAI et FAISS (Facebook AI Similarity Search) de Meta. CLIP convertit le texte et les images en représentations numériques appelées incorporations, qui capturent leur signification et leur contexte. FAISS recherche efficacement parmi des millions de ces incorporations pour trouver celles qui sont les plus pertinentes pour votre requête. 

De plus, une interface web simplifiée, construite avec Flask, rend la solution facile à utiliser. Les utilisateurs peuvent saisir des requêtes en langage naturel et récupérer les images correspondantes sans étiquetage manuel ni préparation des données.

L'un des principaux avantages de cette solution est sa capacité de « zero-shot ». Cela signifie qu'elle peut interpréter et répondre à des requêtes concernant des objets ou des scènes sur lesquels elle n'a pas été spécifiquement entraînée. En tirant parti de sa large compréhension du langage et des éléments visuels, elle peut renvoyer des résultats pertinents, même pour un contenu inconnu ou non étiqueté.

Par exemple, si vous utilisez la solution pour rechercher un « environnement de bureau », elle peut renvoyer des images de bureaux, de salles de réunion ou d'espaces de travail, même si ces mots ne sont pas liés aux fichiers. Cela fait de la recherche d'images sémantique d'Ultralytics un outil pratique et flexible pour les projets créatifs, la recherche et le travail avec de grandes bibliothèques d'images.

Fig. 2. Recherche d'images d'un environnement de bureau à l'aide de la solution de recherche d'images sémantique d'Ultralytics.

Applications concrètes de la solution de recherche d'images sémantiques

Maintenant que nous comprenons mieux la solution de recherche sémantique d'images d'Ultralytics, examinons quelques applications concrètes et voyons comment différents secteurs peuvent l'intégrer à leurs flux de travail visuels.

Utilisation d'outils de recherche d'images basés sur l'IA pour la gestion des ensembles de données

La gestion d'énormes ensembles de données d'images est l'une des tâches les plus chronophages de la création de solutions de vision par ordinateur. Dans la plupart des cas, les développeurs n'ont pas besoin de l'ensemble des données. Au lieu de cela, ils peuvent être à la recherche de types spécifiques d'images pour entraîner des modèles ou créer des ensembles de validation propres. Mais trouver ces images exactes parmi des milliers peut être délicat.

Supposons que vous travaillez sur un projet impliquant des images d'équitation. Vous n'avez peut-être besoin que de photos où le cavalier porte un casque, monte avec d'autres personnes ou est capturé en plein mouvement de côté. Sans étiquettes appropriées, la recherche manuelle de ces images peut prendre beaucoup de temps et d'efforts.

La solution de recherche d'images sémantique, prise en charge par Ultralytics, peut résoudre ce problème en permettant aux développeurs d'utiliser des requêtes en langage naturel pour trouver rapidement ce dont ils ont besoin, même dans des ensembles de données désordonnés ou non étiquetés. Cela réduit le temps passé au tri et permet aux équipes de se concentrer plus efficacement sur la création de meilleurs modèles.

Fig. 3. Vous pouvez facilement rechercher des images spécifiques dans de grands ensembles de données.

Recherche d'images zero-shot pour les produits de commerce électronique 

La recherche de produits spécifiques en ligne peut être frustrante. Les acheteurs décrivent souvent ce qu'ils recherchent avec leurs propres mots, mais les listes de produits peuvent utiliser des termes ou des étiquettes différents. Ce décalage rend plus difficile la recherche des bons articles, en particulier dans les grands catalogues.

Prenons l'exemple d'une personne qui achète des meubles et recherche un « ensemble canapé, chaise et table ». Le produit qu'elle recherche peut être répertorié sous une étiquette différente, telle qu'un « ensemble salon trois pièces ». Étant donné que les termes ne correspondent pas exactement, l'article peut ne pas apparaître dans les résultats de recherche, même si c'est exactement ce dont le client a besoin.

Fig. 4. La solution de recherche sémantique d'images d'Ultralytics aide à faire correspondre l'intention de l'utilisateur avec des visuels de produits pertinents.

Indexation d'images avancée pour les médias et l'édition

De même, dans des domaines comme le journalisme, le blogging et le marketing numérique, les visuels sont essentiels pour la narration. La bonne image peut soutenir un message, donner le ton et maintenir l'engagement des lecteurs. Cependant, trouver l'image parfaite signifie souvent fouiller dans de nombreux fichiers.

Un bon exemple est celui d'un blogueur qui écrit sur les tendances de la décoration intérieure. Il pourrait vouloir une image d'un salon lumineux et minimaliste avec un éclairage naturel. Toutefois, si les images disponibles ne sont étiquetées qu'avec des termes génériques tels que « pièce » ou « intérieur », il peut être frustrant de trouver la correspondance idéale. 

Grâce à la recherche d'images sémantique, ils peuvent simplement taper une phrase descriptive comme « un salon minimaliste lumineux avec de grandes fenêtres » et récupérer instantanément des images qui correspondent à l'idée. Il n'est pas nécessaire de s'appuyer sur des balises exactes ou des noms de fichiers.

Fig 5. Les équipes de contenu peuvent utiliser la solution de recherche d'images sémantique d'Ultralytics pour optimiser la sélection des images.

Recherche d'images sémantique pour l'inspiration artistique et de design

En général, un travail créatif comme la conception d'un tableau d'ambiance ou la recherche d'inspiration pour un nouveau projet implique la recherche dans de vastes collections d'images pour trouver des visuels qui correspondent à un style ou à une idée spécifique. Un exemple intéressant est celui des concepteurs travaillant sur un décor pour un film. Ils peuvent avoir besoin de capturer une ambiance, une période ou une atmosphère particulière. Cela peut aller d'une ville futuriste à un salon confortable de style années 1980.

La recherche sémantique d'images d'Ultralytics facilite cette tâche en reliant le langage à la signification visuelle. Cela permet aux équipes d'explorer rapidement des idées et de rester concentrées, sans être ralenties par la recherche manuelle.

Fig. 6. La solution de recherche d'images sémantiques d'Ultralytics permet une exploration visuelle plus rapide pour les projets créatifs.

Avantages et inconvénients de la recherche d'images basée sur l'IA

Voici quelques-uns des principaux avantages de l'utilisation de la recherche d'images basée sur l'IA pour améliorer les flux de travail visuels et l'efficacité de la recherche :

  • Prise en charge du langage naturel : Les utilisateurs peuvent trouver des images en les décrivant avec leurs propres mots, sans utiliser d'étiquettes prédéfinies.
  • Prise en charge des formats d'image courants : Ces systèmes fonctionnent généralement avec des formats standard tels que JPG et PNG, il n'est donc pas nécessaire de convertir ou de reformater les fichiers.
  • S'intègre à d'autres outils : La recherche d'images basée sur l'IA peut souvent être intégrée dans des pipelines, des tableaux de bord ou des logiciels de création plus vastes.

Bien que les solutions de recherche d'images basées sur l'IA offrent de nombreux avantages, il existe également quelques limitations à garder à l'esprit. Voici quelques facteurs à considérer :

  • Précision limitée avec les requêtes de niche : Si une requête est très spécifique ou inhabituelle, le système peut renvoyer des résultats moins pertinents en raison de lacunes dans les données d'entraînement du modèle.
  • Biais dans les données d'entraînement : Les modèles d'IA peuvent refléter les biais présents dans les ensembles de données sur lesquels ils ont été entraînés, ce qui peut conduire à des résultats faussés ou incomplets.
  • Les performances dépendent de la qualité de l'image : Les images de basse résolution ou floues peuvent réduire l'efficacité de la génération d'intégrations et la précision de la recherche.

Principaux points à retenir

La recherche d'images sémantique déplace l'attention de la correspondance des mots-clés à la compréhension du sens, aidant les utilisateurs à trouver des images basées sur le contexte plutôt que sur de simples balises ou noms de fichiers. Cela rend l'expérience de recherche plus rapide, plus précise et mieux alignée sur ce que les utilisateurs recherchent réellement. 

Pour les équipes créatives et les industries axées sur le contenu, cela signifie moins de temps passé à trier les fichiers non pertinents et plus de temps à développer des idées. Les organisations qui gèrent de grands volumes de données visuelles peuvent utiliser des solutions telles que la recherche d'images sémantiques d'Ultralytics pour rationaliser la découverte de contenu, réduire le tri manuel et prendre des décisions plus intelligentes et plus rapides en fonction du contexte visuel.

Rejoignez notre communauté et explorez notre dépôt GitHub pour en savoir plus sur l'IA. Consultez nos pages de solutions pour en savoir plus sur les innovations telles que l'IA dans la logistique et la vision artificielle dans le secteur de la santé. Consultez nos options de licence et lancez-vous dès aujourd'hui !

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers