Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

GPT (Generative Pre-trained Transformer)

Explora los fundamentos de GPT (Transformador preentrenado generativo). Aprende cómo funcionan estos modelos y cómo integrarlos con Ultralytics YOLO26 para visión artificial.

GPT (Generative Pre-trained Transformer) se refiere a una familia de modelos de red neuronal diseñados para generar texto similar al humano y resolver tareas complejas mediante la predicción del siguiente elemento en una secuencia. Estos modelos están construidos sobre la arquitectura Transformer, utilizando específicamente bloques decodificadores que les permiten procesar datos en paralelo en lugar de secuencialmente. El aspecto "Pre-trained" (pre-entrenado) indica que el modelo se somete a una fase inicial de unsupervised learning en conjuntos de datos masivos —que abarcan libros, artículos y sitios web— para aprender la estructura estadística del lenguaje. "Generative" (generativo) significa la capacidad principal del modelo: crear nuevo contenido en lugar de simplemente clasificar entradas existentes.

Link to this sectionArquitectura y funcionalidad básica#

En el corazón de un modelo GPT se encuentra el attention mechanism, una técnica matemática que permite a la red ponderar la importancia de diferentes palabras en una oración en relación con las demás. Este mecanismo permite al modelo entender el contexto, los matices y las dependencias a largo plazo, como saber que un pronombre al final de un párrafo se refiere a un sustantivo mencionado al principio.

Tras el pre-entrenamiento inicial, estos modelos suelen someterse a un fine-tuning para especializarlos en tareas específicas o para alinearlos con los valores humanos. Técnicas como el Reinforcement Learning from Human Feedback (RLHF) se utilizan a menudo para asegurar que el modelo produzca respuestas seguras, útiles y precisas. Este proceso de dos pasos —pre-entrenamiento general seguido de un ajuste fino específico— es lo que convierte a los modelos GPT en versátiles foundation models.

Link to this sectionAplicaciones en el mundo real#

Los modelos GPT han pasado de la investigación teórica a herramientas prácticas y cotidianas en diversos sectores.

  • Asistentes de codificación inteligentes: Los desarrolladores utilizan herramientas impulsadas por la tecnología GPT para escribir, depurar y documentar software. Estos AI agents analizan el contexto de un repositorio de código para sugerir funciones completas o identificar errores, lo que acelera significativamente el ciclo de vida del desarrollo.
  • Automatización del servicio al cliente: Los chatbots modernos aprovechan GPT para gestionar consultas complejas de clientes. A diferencia de los sistemas antiguos basados en reglas, estos virtual assistants pueden entender la intención, mantener el historial de la conversación y generar respuestas personalizadas en tiempo real.

Link to this sectionIntegración de GPT con la visión artificial#

Aunque GPT destaca en Natural Language Processing (NLP), se combina frecuentemente con Computer Vision (CV) para crear sistemas multimodales. Un flujo de trabajo habitual consiste en utilizar un detector de alta velocidad como Ultralytics YOLO26 para identificar objetos en una imagen y, a continuación, introducir esa salida estructurada en un modelo GPT para generar una narrativa descriptiva.

El siguiente ejemplo demuestra cómo extraer nombres de objetos utilizando YOLO26 para crear una cadena de contexto para un prompt de GPT:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected class names to construct a text description
class_names = [model.names[int(cls)] for cls in results[0].boxes.cls]

# This string serves as the context for a GPT prompt
print(f"Detected objects for GPT context: {', '.join(class_names)}")

Link to this sectionConceptos relacionados y diferenciación#

Es útil distinguir a GPT de otras arquitecturas populares para entender su papel específico.

  • GPT vs. BERT: Ambos utilizan la arquitectura Transformer, pero difieren en la direccionalidad. BERT (Bidirectional Encoder Representations from Transformers) es un modelo exclusivo de codificador que observa el contexto tanto desde la izquierda como desde la derecha simultáneamente, lo que lo hace ideal para tareas como la clasificación y el sentiment analysis. GPT es un modelo exclusivo de decodificador que predice el siguiente token basándose en los anteriores, optimizándolo para la text generation.
  • GPT vs. LLM: El término Large Language Model (LLM) es una categoría amplia para modelos masivos entrenados en vastas cantidades de texto. GPT es una arquitectura específica y una marca de LLM, desarrollada principalmente por OpenAI.

Link to this sectionDesafíos y perspectivas de futuro#

A pesar de sus impresionantes capacidades, los modelos GPT se enfrentan a desafíos como la hallucination, donde generan información falsa con total confianza. Los investigadores trabajan activamente en la mejora de los protocolos de AI ethics y seguridad. Además, la integración de GPT con herramientas como la Ultralytics Platform permite obtener pipelines más robustos donde los modelos de visión y lenguaje trabajan conjuntamente para resolver problemas complejos del mundo real.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático