Instruction Tuning

Descubre cómo el ajuste por instrucciones alinea los modelos de IA con la intención humana. Aprende a entrenar Ultralytics YOLO26 y otros modelos para seguir directivas específicas y mejorar en tareas.

El ajuste de instrucciones es una técnica especializada de aprendizaje automático que se utiliza para entrenar modelos para que sigan directivas o comandos específicos del usuario. A diferencia del preentrenamiento estándar, que a menudo se centra en predecir la siguiente palabra en una secuencia o en reconocer patrones generales en los datos, el ajuste de instrucciones aprovecha conjuntos de datos formateados como tareas directas. Al exponer el modelo a pares de entrada-salida estructurados como comandos explícitos y sus correspondientes respuestas correctas, los desarrolladores pueden transformar un modelo base de propósito general en un asistente altamente receptivo y orientado a tareas. Este enfoque se utiliza ampliamente en IA generativa para alinear los modelos con la intención humana, garantizando que los resultados sean relevantes, seguros y procesables.

Link to this sectionCómo funciona el ajuste de instrucciones#

El proceso implica actualizar los pesos del modelo utilizando un conjunto de datos de instrucciones altamente curado. Estos conjuntos de datos abarcan diversos dominios, desde la resolución de ecuaciones matemáticas hasta el análisis de imágenes. Durante el entrenamiento, el modelo aprende la relación estructural entre la formulación imperativa de una instrucción (por ejemplo, "Resume este texto" o "Identifica los objetos en esta imagen") y el formato de salida deseado. Investigaciones recientes, como los estudios sobre FLAN (Fine-tuned Language Net) de Google, demuestran que los modelos ajustados por instrucciones exhiben capacidades de aprendizaje zero-shot muy mejoradas en tareas no vistas previamente.

Link to this sectionAplicaciones en el mundo real#

El ajuste de instrucciones ha desbloqueado capacidades transformadoras en modalidades de texto y visuales:

Asistentes de IA interactivos: Los chatbots modernos dependen en gran medida del ajuste de instrucciones para procesar diálogos complejos y ejecutar lógica de varios pasos. Este ajuste garantiza que cuando un usuario solicita al sistema que formatee los datos como un objeto JSON, el modelo se ciña estrictamente a esa restricción en lugar de generar relleno conversacional. La investigación de OpenAI sobre InstructGPT destaca cómo esta técnica reduce las salidas tóxicas y mejora la alineación.
Modelos de visión-lenguaje (VLM): En visión por ordenador, el ajuste de instrucciones se utiliza para crear sistemas de visión flexibles y basados en prompts. En lugar de una tubería rígida de detección de objetos que detecta un conjunto fijo de clases, un modelo de visión ajustado por instrucciones puede procesar un comando como "Encuentra el producto defectuoso en la línea de montaje" y ajustar su enfoque dinámicamente.

Para gestionar los conjuntos de datos de alta calidad necesarios para estos flujos de trabajo avanzados, los equipos suelen recurrir a la plataforma Ultralytics, que simplifica la anotación de conjuntos de datos, la organización de proyectos y las implementaciones de entrenamiento en la nube.

Link to this sectionDistinguir conceptos relacionados#

Para diseñar correctamente las tuberías de IA, es importante distinguir el ajuste de instrucciones de otras técnicas de optimización de modelos similares:

Prompt Tuning vs. Ajuste de instrucciones: El prompt tuning es un método eficiente en cuanto a parámetros que optimiza un pequeño conjunto de "prompts suaves" (tensores aprendibles) mientras se mantiene el modelo base congelado. Por el contrario, el ajuste de instrucciones normalmente implica actualizar todo el modelo (o porciones significativas del mismo) utilizando aprendizaje supervisado en conjuntos de datos de instrucciones.
Fine-tuning vs. Ajuste de instrucciones: El ajuste tradicional (fine-tuning) adapta un modelo a un dominio específico (por ejemplo, literatura médica) sin enseñar necesariamente cómo seguir comandos. El ajuste de instrucciones es un subconjunto distinto del fine-tuning diseñado explícitamente para mejorar la ejecución de tareas y la comprensión del lenguaje natural a través de una amplia gama de instrucciones variadas.

Link to this sectionAdaptación de modelos en la práctica#

Para los desarrolladores que construyen tuberías de visión por ordenador personalizadas, adaptar un modelo base a las restricciones de tareas específicas es un requisito común. Si bien el ajuste de instrucciones completo requiere conjuntos de datos masivos especializados, la adaptación de modelos potentes como Ultralytics YOLO26 a tareas de dominio específico utiliza principios similares de adaptación supervisada.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

Al aprovechar estas metodologías de entrenamiento avanzadas, los desarrolladores pueden implementar sistemas de IA robustos que interpreten y ejecuten de forma fiable comandos complejos, salvando la brecha entre el aprendizaje profundo teórico y el software práctico centrado en el usuario. Para obtener más información sobre los mecanismos de entrenamiento, explora la documentación oficial de PyTorch sobre el entrenamiento de redes neuronales.

Instruction Tuning

Link to this sectionCómo funciona el ajuste de instrucciones#

Link to this sectionAplicaciones en el mundo real#

Link to this sectionDistinguir conceptos relacionados#

Link to this sectionAdaptación de modelos en la práctica#

Explore solutions

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

¡Construyamos juntos el futuro de la IA!