Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Ajuste de instrucciones

Descubra cómo el ajuste de la instrucción alinea los modelos de IA con la intención humana. Aprenda a entrenar Ultralytics y otros modelos para que sigan directivas específicas y realicen mejor las tareas.

El ajuste de instrucciones es una técnica especializada de aprendizaje automático que se utiliza para entrenar modelos para que sigan directivas o comandos específicos del usuario. A diferencia del preentrenamiento estándar, que a menudo se centra en predecir la siguiente palabra de una secuencia o en reconocer patrones generales en los datos, el ajuste de instrucciones aprovecha conjuntos de datos formateados como tareas directas. Al exponer el modelo a pares de entrada-salida estructurados como comandos explícitos y sus correspondientes respuestas correctas, los desarrolladores pueden transformar un modelo base de uso general en un asistente altamente receptivo y orientado a tareas . Este enfoque se utiliza ampliamente en la IA generativa para alinear los modelos con la intención humana, garantizando que los resultados sean relevantes, seguros y aplicables.

Cómo funciona el ajuste de la instrucción

El proceso consiste en actualizar los pesos del modelo utilizando un conjunto de datos de instrucciones altamente seleccionado. Estos conjuntos de datos abarcan diversos ámbitos, desde la resolución de ecuaciones matemáticas hasta el análisis de imágenes. Durante el entrenamiento, el modelo aprende la relación estructural entre la formulación imperativa de una instrucción (por ejemplo, «Resuma este texto» o «Identifique los objetos de esta imagen») y el formato de salida deseado. Investigaciones recientes, como los estudios sobre FLAN (Fine-tuned Language Net) de Google, demuestran que los modelos ajustados a las instrucciones muestran una mejora considerable en las capacidades de aprendizaje sin entrenamiento previo en tareas desconocidas .

Aplicaciones en el mundo real

El ajuste de las instrucciones ha desbloqueado capacidades transformadoras tanto en el texto como en las modalidades visuales:

  • Asistentes interactivos de IA: Los chatbots modernos dependen en gran medida del ajuste de instrucciones para procesar diálogos complejos y ejecutar lógica de múltiples pasos. Este ajuste garantiza que, cuando un usuario solicita al sistema que formatee datos como un objeto JSON , el modelo se adhiera estrictamente a esa restricción en lugar de generar relleno conversacional. La investigación de OpenAI sobre InstructGPT destaca cómo esta técnica reduce los resultados tóxicos y mejora la alineación.
  • Modelos de visión-lenguaje (VLMs): En la visión por computadora, el ajuste de instrucciones se utiliza para construir sistemas de visión flexibles y rápidos. En lugar de un rígido proceso de detección de objetos que detecta un conjunto fijo de clases, un modelo de visión ajustado por instrucciones puede procesar un comando como «Encuentra el producto defectuoso en la línea de montaje» y ajustar su enfoque de forma dinámica.

Para gestionar los conjuntos de datos de alta calidad necesarios para estos flujos de trabajo avanzados, los equipos suelen recurrir a la Ultralytics , que simplifica la anotación de conjuntos de datos, la organización de proyectos y las implementaciones de formación basadas en la nube.

Distinguir conceptos relacionados

Para diseñar correctamente los procesos de IA, es importante distinguir el ajuste de instrucciones de técnicas similares de optimización de modelos :

  • Ajuste de indicaciones frente a ajuste de instrucciones: El ajuste de indicaciones es un método eficiente en cuanto a parámetros que optimiza un pequeño conjunto de «indicaciones suaves» (tensores aprendibles ) mientras mantiene congelado el modelo base. Por el contrario, el ajuste de instrucciones suele implicar la actualización de todo el modelo (o partes significativas del mismo) mediante el aprendizaje supervisado en conjuntos de datos de instrucciones.
  • Ajuste fino frente a ajuste por instrucción: El ajuste fino tradicional adapta un modelo a un dominio específico (por ejemplo, la literatura médica) sin necesariamente enseñarle cómo seguir órdenes. El ajuste por instrucción es un subconjunto distinto del ajuste fino, diseñado explícitamente para mejorar la ejecución de tareas y la comprensión del lenguaje natural en una amplia gama de instrucciones variadas.

Adaptación de modelos en la práctica

Para los desarrolladores que crean procesos de visión artificial personalizados, adaptar un modelo básico a las limitaciones de una tarea específica es un requisito habitual. Si bien el ajuste completo de las instrucciones requiere conjuntos de datos masivos especializados, la adaptación de modelos potentes como Ultralytics a tareas de dominio específicas utiliza principios similares de adaptación supervisada.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

Al aprovechar estas metodologías de entrenamiento avanzadas, los desarrolladores pueden implementar sistemas de IA robustos que interpretan y ejecutan comandos complejos de forma fiable, salvando la brecha entre el aprendizaje profundo teórico y el software práctico y centrado en el usuario . Para obtener más información sobre los mecanismos de entrenamiento, consulte PyTorch oficial PyTorch sobre el entrenamiento de redes neuronales.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora