Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

GPT-3

Explora GPT-3, el potente LLM de 175B de parámetros de OpenAI. Aprende sobre su arquitectura, tareas de PNL y cómo combinarlo con Ultralytics YOLO26 para aplicaciones de visión y lenguaje.

Generative Pre-trained Transformer 3, conocido comúnmente como GPT-3, es un Large Language Model (LLM) sofisticado desarrollado por OpenAI que utiliza el aprendizaje profundo para producir texto similar al humano. Como modelo de tercera generación en la serie GPT, representó un salto significativo en las capacidades de Natural Language Processing (NLP) tras su lanzamiento. Al procesar texto de entrada y predecir la palabra siguiente más probable en una secuencia, GPT-3 puede realizar una gran variedad de tareas, desde redactar ensayos y código hasta traducir idiomas, sin necesidad de entrenamiento específico para cada tarea individual, una capacidad conocida como few-shot learning.

Link to this sectionArquitectura y funcionalidad básica#

GPT-3 se basa en la Transformer architecture, utilizando específicamente una estructura de solo decodificador. Es de escala masiva y cuenta con 175 mil millones de parámetros de aprendizaje automático, lo que le permite capturar matices en el lenguaje, el contexto y la sintaxis con alta fidelidad. El modelo se somete a un unsupervised learning extensivo sobre un vasto corpus de datos de texto de Internet, incluyendo libros, artículos y sitios web.

Durante la inferencia, interactúas con el modelo mediante prompt engineering. Al proporcionar una entrada de texto estructurada, guías al modelo para que genere resultados específicos, como resumir un documento técnico o hacer una lluvia de ideas creativas.

Link to this sectionAplicaciones en el mundo real#

La versatilidad de GPT-3 le permite potenciar numerosas aplicaciones en diferentes industrias.

  1. Creación automática de contenido: Las plataformas de marketing utilizan GPT-3 para generar descripciones de productos, publicaciones de blog y textos publicitarios. Al aprovechar la text generation, las empresas pueden escalar su producción de contenido manteniendo una voz de marca coherente.

  2. Atención al cliente inteligente: Muchos chatbots y asistentes virtuales modernos dependen de GPT-3 para entender consultas complejas de los usuarios y proporcionar respuestas conversacionales. A diferencia de los sistemas antiguos basados en árboles de decisión rígidos, estos agentes pueden manejar preguntas abiertas de forma eficaz.

Link to this sectionIntegración de visión y lenguaje#

Aunque GPT-3 es un modelo basado en texto, a menudo funciona como el "cerebro" en pipelines que comienzan con Computer Vision (CV). Un flujo de trabajo común implica el uso de un detector de objetos de alta velocidad para analizar una imagen y, a continuación, enviar los resultados de la detección a GPT-3 para generar una descripción narrativa o un informe de seguridad.

El siguiente ejemplo demuestra cómo utilizar el modelo Ultralytics YOLO26 para detectar objetos y formatear la salida como un prompt de texto adecuado para un LLM:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for real-time edge performance)
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names to create a context string
detected_classes = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = f"The image contains: {', '.join(detected_classes)}."

# This string can now be sent to GPT-3 for further processing
print(f"LLM Prompt: {context_string} Describe the potential activity.")

Link to this sectionComparación con modelos relacionados#

Comprender dónde encaja GPT-3 en el panorama de la IA requiere distinguirlo de tecnologías similares:

  • GPT-3 frente a GPT-4: GPT-3 es unimodal, lo que significa que solo acepta y genera texto. Su sucesor, GPT-4, introduce capacidades de Multimodal AI, permitiéndole procesar imágenes y texto simultáneamente.
  • GPT-3 frente a BERT: BERT es un modelo de solo codificador diseñado por Google principalmente para tareas de comprensión de contexto y clasificación como el sentiment analysis. GPT-3 es un modelo de solo decodificador optimizado para tareas generativas.

Link to this sectionDesafíos y consideraciones#

A pesar de su potencia, GPT-3 requiere muchos recursos y necesita GPUs potentes para un funcionamiento eficiente. También se enfrenta a desafíos con la hallucination in LLMs, donde el modelo presenta hechos incorrectos con seguridad. Además, debes tener en cuenta la AI Ethics, ya que el modelo puede reproducir inadvertidamente algorithmic bias presente en sus datos de entrenamiento.

Los desarrolladores que buscan construir pipelines complejos que involucren tanto visión como lenguaje pueden utilizar la Ultralytics Platform para gestionar sus datasets y entrenar modelos de visión especializados antes de integrarlos con APIs de LLM. Para una comprensión más profunda de los mecanismos subyacentes, el artículo de investigación original Language Models are Few-Shot Learners proporciona detalles técnicos exhaustivos.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático