Glossaire

IA générative

Découvrez comment l'IA générative crée des contenus originaux tels que du texte, des images et du son, transformant les industries grâce à des applications innovantes.

L'IA générative est une catégorie de systèmes d'intelligence artificielle (IA) capables de créer un contenu nouveau et original, notamment du texte, des images, du son et de la vidéo. Contrairement à l'IA traditionnelle qui analyse ou agit sur des données existantes, les modèles génératifs apprennent les modèles et structures sous-jacents à partir d'un vaste corpus de données d'entraînement pour produire de nouveaux résultats qui imitent les caractéristiques des données sur lesquelles ils ont été entraînés. Cette technologie est alimentée par des modèles d'apprentissage profond complexes, tels que les modèles de langage de grande taille (LLM), qui sont devenus de plus en plus accessibles et puissants.

Comment fonctionne l'IA générative ?

À la base, l'IA générative repose sur des réseaux neuronaux (RN) formés sur des ensembles massifs de données. Au cours de la formation, le modèle apprend une distribution probabiliste des données. Lorsqu'il reçoit une invite ou une entrée, il utilise cette distribution apprise pour prédire et générer l'élément suivant le plus probable dans une séquence, qu'il s'agisse d'un mot, d'un pixel ou d'une note de musique. Ce processus est répété pour construire un contenu complet. De nombreux modèles génératifs modernes reposent sur l'architecture Transformer, qui utilise un mécanisme d'attention pour évaluer l'importance des différentes parties des données d'entrée, ce qui lui permet de capturer des dépendances complexes à longue portée et de générer des résultats très cohérents. Ces modèles puissants et pré-entraînés sont souvent appelés modèles de base.

IA générative et IA discriminative

Le pendant de l'IA générative est l'IA discriminante. La différence essentielle réside dans leurs objectifs :

  • Modèles génératifs : Apprendre la distribution des données pour créer de nouveaux échantillons de données. Leur objectif est de répondre à la question "À quoi ressemblent les données ?". Les modèles de synthèse texte-image ou de génération de texte en sont des exemples.
  • Modèles discriminants : Ils apprennent la frontière entre les différentes classes de données afin de classer ou de prédire une étiquette pour une entrée donnée. Leur objectif est de répondre à la question "Quelle est la différence entre ces groupes ?". La plupart des tâches d'apprentissage supervisé, telles que la classification d'images et la détection d'objets réalisées par des modèles comme Ultralytics YOLO, entrent dans cette catégorie.

Alors que les modèles discriminatifs sont excellents pour la catégorisation et la prédiction, les modèles génératifs excellent dans la création et l'augmentation.

Applications dans le monde réel

L'IA générative transforme de nombreuses industries avec un large éventail d'applications :

  1. Création et augmentation de contenu: Des modèles comme GPT-4 peuvent écrire des articles, des courriels et du code, tandis que des modèles texte-image comme DALL-E 3 et Midjourney créent des images étonnantes à partir de simples descriptions textuelles. Cela révolutionne des domaines allant du marketing et du divertissement au développement de logiciels, avec des outils tels que GitHub Copilot pour aider les développeurs.
  2. Génération de données synthétiques: L'IA générative peut créer des données artificielles réalistes pour entraîner d'autres modèles d'apprentissage automatique. Par exemple, dans l'IA automobile, elle peut générer des scénarios de conduite rares pour améliorer la robustesse des modèles de perception dans les véhicules autonomes. De même, dans le domaine de la santé, elle peut produire des images médicales synthétiques pour former des outils de diagnostic, ce qui permet de surmonter les difficultés liées à la confidentialité des données et aux ensembles de données limités. Cette technique complète l'augmentation traditionnelle des données.

Types courants de modèles génératifs

Plusieurs architectures ont joué un rôle essentiel dans l'avancement de l'IA générative :

  • Réseaux adversoriels génératifs (GAN): Constitués de deux réseaux neuronaux concurrents - un générateur et un discriminateur - qui travaillent ensemble pour créer des résultats très réalistes.
  • Modèles de diffusion: Ajoutez progressivement du bruit à une image, puis apprenez à inverser le processus pour générer des images de haute fidélité. C'est la technologie qui sous-tend des modèles tels que la diffusion stable.
  • Grands modèles linguistiques (LLM): Basés sur l'architecture Transformer, ces modèles sont entraînés sur de grandes quantités de données textuelles afin de comprendre et de générer un langage semblable à celui des humains. Des organismes de recherche de premier plan comme Google AI et Meta AI repoussent sans cesse les limites du possible.

Défis et considérations éthiques

L'essor rapide de l'IA générative pose des problèmes importants. Le risque d'utilisation abusive, comme la création de "deepfakes" pour des campagnes de désinformation ou la violation des droits de propriété intellectuelle, est une préoccupation majeure. Les modèles peuvent également perpétuer et amplifier les biais algorithmiques présents dans leurs données d'apprentissage. La résolution de ces problèmes nécessite un engagement fort en faveur de l'éthique de l'IA et l'élaboration de cadres de gouvernance robustes. En outre, l'entraînement de ces grands modèles nécessite beaucoup de calculs, ce qui soulève des inquiétudes quant à leur impact sur l'environnement. Une gestion efficace du cycle de vie des modèles par le biais de plateformes MLOps comme Ultralytics HUB peut contribuer à rationaliser le développement et le déploiement.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers