Glossaire

Token

Découvrez comment les tokens, les éléments constitutifs des modèles d'IA, alimentent le NLP, la vision par ordinateur et des tâches telles que l'analyse des sentiments et la détection d'objets.

Dans le paysage de l'intelligence l'intelligence artificielle, un jeton sert d'unité l'unité fondamentale et atomique d'information qu'un modèle d'apprentissage automatique traite. Avant qu'un réseau neuronal ne puisse analyser une phrase, un extrait de ou même une image, les données brutes doivent être segmentées en ces éléments discrets et gérables par le biais d'une étape critique du prétraitement des données. étape critique du prétraitement des données. Alors que les humains perçoivent le langage comme un flux de mots ou les images comme une scène continue, les algorithmes exigent que ces données soient décomposées en éléments normalisés pour effectuer des calculs. en éléments standardisés afin d'effectuer des calculs de manière efficace.

Token vs. Tokenisation

Pour comprendre le fonctionnement des systèmes modernes d'apprentissage profond, il est essentiel de faire la distinction entre l'unité de données et le processus qui la crée. modernes, il est essentiel de faire la distinction entre l'unité de données et le processus qui la crée. Cette distinction est souvent clarifiée en comparant le "quoi" et le "comment".

Jeton : Il s'agit de la sortie, c'est-à-dire de l'ensemble des données introduites dans le modèle. Dans le traitement de texte, un jeton peut représenter un mot entier, une partie d'un mot (sous-mot) ou un seul caractère. Dans le domaine de la vision par ordinateur, il représente souvent une une zone spécifique de pixels.
La tokenisation: Il s'agit du processus algorithmique consistant à diviser les données brutes en jetons. Par exemple, des outils spécialisés dans des bibliothèques telles que spaCy ou NLTK gèrent les règles qui déterminent la fin d'un un jeton se termine et le suivant commence.

Le rôle des jetons dans les architectures d'IA

Une fois les données tokenisées, les tokens résultants ne sont pas utilisés directement comme des chaînes de texte ou des patchs d'image. Au lieu de cela, ils sont Ils sont plutôt mis en correspondance avec des vecteurs numériques connus sous le nom de " embeddings". Ces vecteurs à haute dimension capturent la signification sémantique et les relations entre les tokens, ce qui permet à des cadres comme le PyTorch d'effectuer des opérations mathématiques sur eux.

Les jetons de texte dans le NLP

Dans le domaine du Traitement du langage naturel (NLP), les tokens sont les entrées des grands modèles de langage (LLM) tels que la série série GPT. Les modèles modernes modernes utilisent généralement des algorithmes de tokénisation de sous-mots, tels que Le codage par paires d'octets (BPE). Cette méthode permet d'équilibrer l'efficacité et la taille du vocabulaire en conservant les mots courants sous forme de jetons uniques tout en divisant les mots rares en syllabes significatives. syllabes significatives.

Jetons visuels dans le domaine de la vision par ordinateur

Le concept de jetons a révolutionné l'analyse d'images grâce à des architectures telles que le Vision Transformer (ViT). Au lieu de traitement des pixels par convolution, ces modèles divisent une image en une grille de parcelles de taille fixe (par exemple, 16x16 pixels). pixels). Chaque parcelle est aplatie et traitée comme un "jeton visuel", ce qui permet d'utiliser les puissants mécanismes du Transformateur de vision, tels que l'analyseur d'images. Transformer, comme l'auto-attention, pour comprendre le contexte global au sein d'une image. l 'auto-attention pour comprendre le contexte global d'une d'une image.

Applications concrètes

Les jetons sont les éléments constitutifs de certaines des capacités les plus avancées de l'IA aujourd'hui.

Détection d'objets à vocabulaire ouvert : Des modèles comme YOLO utilisent une une approche multimodale dans laquelle le texte et l'image interagissent. Les utilisateurs peuvent définir des classes personnalisées (par exemple, "sac à dos bleu") sous forme d'invites textuelles. Le modèle Le modèle utilise des jetons pour ces invites et les compare à des jetons visuels dans l'image afin d'effectuer une d 'apprentissage sans avoir besoin d'un réentraînement. réapprentissage.
L'IA générative et les chatbots : Lors de l'interaction avec un chatbot, le système utilise la génération de texte pour prédire l'élément suivant le plus probable d'une le plus probable dans une séquence. Cette prédiction jeton par jeton permet de créer des réponses cohérentes et contextuellement pertinentes, pour des applications allant de l'assistance à la clientèle à l'achèvement de codes. cohérentes et adaptées au contexte, pour des applications allant de l'assistance à la clientèle à l'achèvement de codes.

Exemple : Utilisation de jetons de texte pour la détection

L'exemple suivant montre comment l'option ultralytics Le paquet d'informations sur les tokens est utilisé dans les coulisses. En en fournissant une liste de classes de texte, le modèle utilise des jetons pour identifier dynamiquement des objets spécifiques dans une image. de manière dynamique.

from ultralytics import YOLO

# Load a YOLO-World model capable of understanding text tokens
model = YOLO("yolo11s-world.pt")

# Define custom classes (these are tokenized internally)
model.set_classes(["helmet", "vest"])

# Run prediction; the model matches visual features to the text tokens
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

La compréhension des jetons est essentielle pour comprendre comment les modèles de base comblent le fossé entre la théorie et la pratique. les modèles de fondation comblent le fossé entre les données humaines non structurées et la compréhension informatique. entre les données humaines non structurées et la compréhension informatique. classification d'images ou des tâches linguistiques complexes.

Token

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Token vs. Tokenisation

Le rôle des jetons dans les architectures d'IA

Les jetons de texte dans le NLP

Jetons visuels dans le domaine de la vision par ordinateur

Applications concrètes

Exemple : Utilisation de jetons de texte pour la détection

En savoir plus dans cette catégorie

Tendances futures en matière de détection d'objets : 7 éléments clés à surveiller

Améliorer la réidentification des véhicules avec les modèlesYOLO 'Ultralytics

Améliorer la prédiction des collisions avec les modèles Ultralytics YOLO

Rejoindre la communauté Ultralytics