Constitutional AI
Explora cómo la IA Constitucional alinea los modelos con los valores humanos usando principios éticos. Aprende a implementar controles de seguridad en Visión por Computadora con Ultralytics YOLO26.
La IA constitucional es un método para entrenar sistemas de inteligencia artificial para que se alineen con los valores humanos proporcionándoles un conjunto de principios de alto nivel (una "constitución") en lugar de depender únicamente de una extensa retroalimentación humana sobre resultados individuales. Este enfoque enseña esencialmente al modelo de IA a criticar y revisar su propio comportamiento basándose en un conjunto predefinido de reglas, como "ser útil", "no ser dañino" y "evitar la discriminación". Al integrar estas directrices éticas directamente en el proceso de entrenamiento, los desarrolladores pueden crear sistemas que sean más seguros, transparentes y fáciles de escalar que aquellos que dependen del Aprendizaje por Refuerzo a partir de la Retroalimentación Humana (RLHF) manual.
Link to this sectionEl mecanismo de la IA constitucional#
La innovación principal de la IA constitucional radica en su proceso de entrenamiento en dos fases, que automatiza la alineación de los modelos. A diferencia del aprendizaje supervisado tradicional, donde los humanos deben etiquetar cada respuesta correcta, la IA constitucional utiliza el propio modelo para generar datos de entrenamiento.
-
Fase de aprendizaje supervisado: El modelo genera respuestas a las instrucciones, luego critica su propia salida basándose en los principios constitucionales. Revisa la respuesta para alinearse mejor con las reglas. Este conjunto de datos refinado se utiliza después para ajustar el modelo, enseñándole a seguir las directrices de forma inherente.
-
Fase de aprendizaje por refuerzo: Esta fase, a menudo llamada Aprendizaje por Refuerzo a partir de la Retroalimentación de la IA (RLAIF), reemplaza al etiquetador humano. La IA genera pares de respuestas y selecciona la que mejor se adhiere a la constitución. Estos datos de preferencia entrenan un modelo de recompensa, que luego refuerza los comportamientos deseados mediante técnicas estándar de aprendizaje por refuerzo.
Link to this sectionRelevancia para la visión artificial#
Aunque la IA constitucional se originó en el contexto de los Modelos de Lenguaje Extensos (LLM) desarrollados por organizaciones como Anthropic, sus principios son cada vez más relevantes para tareas de aprendizaje automático más amplias, incluida la Visión por Computador (CV).
- Generación ética de imágenes: Las herramientas de IA Generativa para crear imágenes pueden entrenarse "constitucionalmente" para rechazar instrucciones que generen imágenes violentas, odiosas o con derechos de autor. Esto garantiza que los pesos del modelo codifiquen por sí mismos restricciones de seguridad, evitando la creación de contenido visual dañino.
- Sistemas de visión críticos para la seguridad: En vehículos autónomos, un enfoque "constitucional" puede definir reglas jerárquicas para la toma de decisiones. Por ejemplo, una regla que establezca que "la seguridad humana prevalece sobre la eficiencia del tráfico" puede guiar al modelo al analizar escenas de carretera complejas, asegurando que los resultados de detección de objetos se interpreten con la seguridad como prioridad.
Link to this sectionImplementación de comprobaciones de políticas en la IA de visión#
Aunque el entrenamiento completo de IA constitucional implica complejos bucles de retroalimentación, los desarrolladores pueden aplicar el concepto de "comprobaciones constitucionales" durante la inferencia para filtrar resultados basados en políticas de seguridad. El siguiente ejemplo demuestra el uso de YOLO26 para detectar objetos y aplicar una regla de seguridad para filtrar detecciones de baja confianza, imitando una constitución de fiabilidad.
from ultralytics import YOLO
# Load the YOLO26 model (latest stable Ultralytics release)
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Apply a "constitutional" safety check: Only accept high-confidence detections
for result in results:
# Filter boxes with confidence > 0.5 to ensure reliability
safe_boxes = [box for box in result.boxes if box.conf > 0.5]
print(f"Safety Check Passed: {len(safe_boxes)} reliable objects detected.")
# Further processing would only use 'safe_boxes'Link to this sectionIA constitucional frente a RLHF convencional#
Es importante distinguir la IA constitucional del Aprendizaje por Refuerzo a partir de la Retroalimentación Humana (RLHF) estándar.
- Escalabilidad: El RLHF requiere grandes cantidades de trabajo humano para calificar los resultados del modelo, lo cual es costoso y lento. La IA constitucional automatiza esto con agentes de IA, haciéndolo altamente escalable.
- Transparencia: En RLHF, el modelo aprende de una "señal de recompensa" opaca (una puntuación), lo que dificulta saber por qué se prefirió un comportamiento. En la IA constitucional, el prompting de cadena de pensamiento utilizado durante la fase de crítica hace que el razonamiento sea explícito y rastreable hasta principios escritos específicos.
- Consistencia: Los evaluadores humanos pueden ser inconsistentes o sesgados. Una constitución escrita proporciona una base estable para la ética de la IA, reduciendo la subjetividad en el proceso de alineación.
Link to this sectionEl futuro de la alineación#
A medida que los modelos evolucionan hacia la Inteligencia Artificial General (AGI), crece la importancia de estrategias de alineación robustas como la IA constitucional. Estos métodos son esenciales para cumplir con los estándares emergentes de organismos como el NIST AI Safety Institute.
La Plataforma Ultralytics ofrece herramientas para gestionar la gobernanza de datos y el monitoreo de modelos, facilitando la creación de sistemas de IA responsables. Al integrar estas consideraciones éticas en el ciclo de vida del desarrollo de IA (desde la recopilación de datos hasta el despliegue del modelo), las organizaciones pueden mitigar riesgos y asegurar que sus tecnologías contribuyan positivamente a la sociedad.






