Aperçu de la solution de recherche sémantique d'images d'Ultralytics

Abirami Vina

5 minutes de lecture

23 juin 2025

Découvrez comment la solution de recherche sémantique d'images d'Ultralytics peut être utilisée pour faire correspondre rapidement des images à des requêtes, rendant ainsi les flux de travail créatifs et de recherche plus efficaces.

Parcourir une galerie de centaines d'images peut rapidement devenir une tâche insurmontable, en particulier lorsque vous essayez de trouver quelque chose de très spécifique. Par exemple, une personne qui cherche une carte de la Rome antique risque de trouver des plans de ville ou des photos de voyage au hasard.

Ces scénarios se produisent parce que la plupart des systèmes de recherche d'images s'appuient sur les noms de fichiers ou les balises. Si cela peut fonctionner pour des requêtes générales, ce n'est souvent pas le cas lorsque l'on a besoin de précision, de détails et de contexte. 

En fait, de nombreuses personnes travaillant dans des domaines tels que la conception, le marketing et la recherche ont du mal à trouver les bonnes images, car les recherches par mot-clé permettent rarement de saisir l'idée spécifique qu'elles recherchent. Cela peut entraîner des retards et perturber la productivité.

Toutefois, grâce aux progrès récents de l'intelligence artificielle (IA), les limites traditionnelles des outils de recherche d'images sont remplacées par des systèmes plus intelligents et plus intuitifs. Par exemple, la vision artificielle, une branche de l'IA qui se concentre sur l'interprétation et la compréhension des données visuelles, permet des recherches d'images plus rapides et plus précises en analysant le contenu réel des images.

En particulier, la recherche sémantique d'images va au-delà de la correspondance des mots-clés en comprenant le sens de la recherche. Elle vous permet d'utiliser un langage naturel pour décrire ce que vous recherchez et de trouver des images qui correspondent à l'idée, et pas seulement aux mots-clés. Par exemple, une recherche pour "animaux dans un zoo" pourrait renvoyer des images d'animaux au hasard dans un système traditionnel, alors qu'une recherche sémantique comprend le contexte et trouve des images d'animaux dans des zoos.

Fig. 1. Exemple d'utilisation de la recherche sémantique d'images pour retrouver des images d'animaux dans un zoo.

Dans cet article, nous allons explorer le fonctionnement de la recherche sémantique d'images et discuter de quelques cas d'utilisation réels. Nous examinerons également la solution de recherche sémantique d'images d'Ultralytics, qui permet d'appliquer facilement ce concept dans des projets quotidiens. C'est parti !

Aperçu de la solution de recherche sémantique d'images d'Ultralytics

Le package Ultralytics Python offre une gamme de solutions prêtes à l'emploi pour des applications courantes de vision par ordinateur, notamment la gestion des files d'attente, le comptage d'objets par région, le calcul de la distance et la recherche sémantique d'images. Ces solutions sont conçues pour être faciles à utiliser, même pour ceux qui n'ont pas d'expertise en IA ou en vision par ordinateur.

Parmi elles, la solution de recherche sémantique d'images permet aux utilisateurs de trouver des images pertinentes en utilisant des descriptions en langage naturel au lieu de s'appuyer sur des noms de fichiers ou des étiquettes manuelles. Elle comprend le sens d'une requête et renvoie les images qui correspondent à l'idée, ce qui la rend particulièrement utile lorsque la précision et le contexte sont importants.

Fonctionnement de la solution de recherche sémantique d'images

La solution de recherche sémantique d'images d'Ultralytics est alimentée par deux modèles d'IA avancés : CLIP (Contrastive Language - Image Pre-Training) d'OpenAI et FAISS (Facebook AI Similarity Search) de Meta. CLIP convertit le texte et les images en représentations numériques appelées embeddings, qui capturent leur signification et leur contexte. FAISS recherche efficacement parmi des millions de ces embeddings ceux qui sont les plus pertinents par rapport à votre requête. 

De plus, une interface web rationalisée construite avec Flask rend la solution facile à utiliser. Les utilisateurs peuvent saisir des requêtes en langage naturel et récupérer les images correspondantes sans étiquetage manuel ni préparation des données.

L'un des principaux avantages de cette solution est sa capacité à ne pas prendre de photos. Cela signifie qu'il peut interpréter et répondre à des requêtes concernant des objets ou des scènes pour lesquels il n'a pas été spécifiquement formé. En tirant parti de sa compréhension globale du langage et des images, il peut renvoyer des résultats pertinents, même pour des contenus peu familiers ou non étiquetés.

Par exemple, si vous utilisez la solution pour rechercher un "environnement de bureau", elle peut renvoyer des images de bureaux, de salles de réunion ou d'espaces de travail, même si ces mots ne sont pas liés aux fichiers. La recherche sémantique d'images d'Ultralytics est donc un outil pratique et flexible pour les projets créatifs, la recherche et le travail avec de grandes bibliothèques d'images.

Fig. 2. Recherche d'images d'un environnement de bureau à l'aide de la solution de recherche sémantique d'images d'Ultralytics.

Applications réelles de la solution de recherche sémantique d'images

Maintenant que nous avons une meilleure compréhension de la solution de recherche sémantique d'images d'Ultralytics, examinons quelques applications réelles et voyons comment différentes industries peuvent l'intégrer dans leurs flux de travail visuels.

Utilisation d'outils de recherche d'images alimentés par l'IA pour la gestion des ensembles de données

La gestion d'énormes ensembles de données d'images est l'une des tâches les plus fastidieuses de l'élaboration de solutions de vision par ordinateur. Dans la plupart des cas, les développeurs n'ont pas besoin de l'ensemble des données. Ils recherchent plutôt des types d'images spécifiques pour entraîner des modèles ou créer des ensembles de validation propres. Mais trouver ces images exactes parmi des milliers d'autres peut s'avérer délicat.

Supposons que vous travailliez sur un projet impliquant des images d'équitation. Vous n'aurez peut-être besoin que de photos où le cavalier porte un casque, où il monte avec d'autres personnes ou où il est capturé en plein mouvement depuis le côté. Sans étiquettes appropriées, la recherche manuelle de ces images peut prendre beaucoup de temps et d'efforts.

La solution de recherche sémantique d'images, supportée par Ultralytics, peut résoudre ce problème en permettant aux développeurs d'utiliser des requêtes en langage naturel pour trouver rapidement ce dont ils ont besoin, même dans des ensembles de données désordonnés ou non étiquetés. Cela réduit le temps consacré au tri et permet aux équipes de se concentrer sur la construction de meilleurs modèles de manière plus efficace.

Fig. 3. Vous pouvez facilement rechercher des images spécifiques dans de grands ensembles de données.

Recherche d'images à partir de zéro pour les produits du commerce électronique 

La recherche de produits spécifiques en ligne peut s'avérer frustrante. Les acheteurs décrivent souvent ce qu'ils recherchent avec leurs propres mots, mais les listes de produits peuvent utiliser des termes ou des étiquettes différents. Ce décalage complique la recherche des bons articles, en particulier dans les grands catalogues.

Prenons le cas d'une personne qui achète des meubles et recherche un "ensemble canapé, chaise et table". Le produit qu'il recherche peut être répertorié sous une étiquette différente, par exemple "ensemble de salon trois pièces". Comme les termes ne correspondent pas exactement, l'article peut ne pas apparaître dans les résultats de la recherche, même s'il correspond exactement à ce dont le client a besoin.

Fig. 4. La solution de recherche sémantique d'images d'Ultralytics permet de faire correspondre l'intention de l'utilisateur avec des visuels de produits pertinents.

Indexation avancée des images pour les médias et l'édition

De même, dans des domaines tels que le journalisme, les blogs et le marketing numérique, les images sont essentielles pour raconter une histoire. La bonne image peut appuyer un message, donner le ton et maintenir l'intérêt des lecteurs. Cependant, pour trouver l'image parfaite, il faut souvent fouiller dans de nombreux fichiers.

Un bon exemple est celui d'un blogueur qui écrit sur les tendances en matière de décoration d'intérieur. Il pourrait vouloir une image d'un salon clair et minimaliste avec un éclairage naturel. Cependant, si les images disponibles ne sont étiquetées qu'avec des termes génériques tels que "pièce" ou "intérieur", il peut être frustrant de trouver la bonne correspondance. 

Grâce à la recherche sémantique d'images, il leur suffit de taper une phrase descriptive telle que "un salon minimaliste et lumineux avec de grandes fenêtres" pour retrouver instantanément les images qui correspondent à cette idée. Il n'est pas nécessaire de s'appuyer sur des balises ou des noms de fichiers exacts.

Fig. 5. Les équipes chargées du contenu peuvent utiliser la solution de recherche sémantique d'images d'Ultralytics pour optimiser la sélection des images.

Recherche sémantique d'images pour l'inspiration en matière d'art et de design

En règle générale, les travaux créatifs tels que la conception d'un tableau d'humeur ou la recherche d'inspiration pour un nouveau projet impliquent de parcourir de vastes collections d'images pour trouver des éléments visuels correspondant à un style ou à une idée spécifique. Un exemple intéressant est celui des concepteurs qui travaillent sur le décor d'un film. Ils peuvent avoir besoin de capturer une ambiance, une période ou une atmosphère particulière. Il peut s'agir d'une ville futuriste ou d'un salon confortable datant des années 1980.

La recherche sémantique d'images d'Ultralytics facilite cette tâche en reliant le langage à la signification visuelle. Les équipes peuvent ainsi explorer rapidement les idées et rester concentrées, sans être ralenties par une recherche manuelle.

Fig. 6. La solution de recherche sémantique d'images d'Ultralytics permet une exploration visuelle plus rapide pour les projets créatifs.

Avantages et inconvénients de la recherche d'images par l'IA

Voici quelques-uns des principaux avantages de l'utilisation de la recherche d'images par IA pour améliorer les flux de travail visuels et l'efficacité de la recherche ;

  • Prise en charge du langage naturel : Les gens peuvent trouver des images en les décrivant avec leurs propres mots, sans utiliser d'étiquettes prédéfinies.
  • Prise en charge des formats d'image courants: Ces systèmes fonctionnent généralement avec des formats standard tels que JPG et PNG, de sorte qu'il n'est pas nécessaire de convertir ou de reformater les fichiers.
  • Intégration à d'autres outils: La recherche d'images alimentée par l'IA peut souvent être intégrée à des pipelines, des tableaux de bord ou des logiciels de création plus importants.

Si les solutions de recherche d'images par IA offrent de nombreux avantages, il convient également de garder à l'esprit certaines limites. Voici quelques facteurs à prendre en compte :

  • Précision limitée pour les requêtes de niche : Si une requête est très spécifique ou inhabituelle, le système peut renvoyer des résultats moins pertinents en raison de lacunes dans les données de formation du modèle.
  • Biais dans les données d'entraînement: Les modèles d'IA peuvent refléter les biais présents dans les ensembles de données sur lesquels ils ont été formés, ce qui peut conduire à des résultats biaisés ou incomplets.
  • Les performances dépendent de la qualité de l'image: Les images à faible résolution ou peu claires peuvent réduire l'efficacité de la génération de l'incorporation et la précision de la recherche.

Principaux enseignements

La recherche sémantique d'images met l'accent sur la compréhension du sens plutôt que sur la concordance des mots-clés, en aidant les utilisateurs à trouver des images en fonction du contexte plutôt qu'en fonction des étiquettes ou des noms de fichiers. L'expérience de recherche est ainsi plus rapide, plus précise et mieux alignée sur ce que les utilisateurs recherchent réellement. 

Pour les équipes créatives et les industries axées sur le contenu, cela signifie moins de temps passé à trier des fichiers non pertinents et plus de temps pour développer des idées. Les entreprises qui gèrent de gros volumes de données visuelles peuvent utiliser des solutions telles que la recherche sémantique d'images d'Ultralytics pour rationaliser la découverte de contenu, réduire le tri manuel et prendre des décisions plus intelligentes et plus rapides basées sur le contexte visuel.

Faites partie de notre communauté et explorez notre dépôt GitHub pour en savoir plus sur l'IA. Consultez nos pages de solutions pour en savoir plus sur des innovations telles que l 'IA dans la logistique et la vision par ordinateur dans les soins de santé. Consultez nos options de licence et commencez dès aujourd'hui !

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers