Glosario

IA constitucional

Descubra cómo la IA constitucional garantiza resultados éticos, seguros e imparciales alineando los modelos con principios predefinidos y valores humanos.

La IA constitucional (CAI) es un método desarrollado por Anthropic para entrenar modelos de IA, en particular grandes modelos lingüísticos (LLM), para que se ajusten a un conjunto específico de reglas o principios, conocidos como "constitución". El objetivo principal de la CAI es hacer que los sistemas de IA sean útiles, inofensivos y más controlables sin necesidad de una amplia retroalimentación humana. En lugar de que los humanos etiqueten constantemente los resultados perjudiciales, la IA aprende a criticar y revisar sus propias respuestas basándose en los principios rectores de su constitución. Este enfoque ayuda a abordar retos clave de la ética de la IA, como evitar la generación de contenidos tóxicos y reducir el sesgo algorítmico.

Cómo funciona la IA constitucional

El proceso de formación CAI suele constar de dos fases principales:

  1. Fase de aprendizaje supervisado: Inicialmente, se pide a un modelo de fundación que genere respuestas. A continuación, se pide al mismo modelo que critique sus propias respuestas basándose en la constitución y las reescriba para que se ajusten mejor a sus principios. Así se crea un nuevo conjunto de datos de ejemplos mejorados y alineados con la constitución. Este mecanismo de autocrítica se guía por una constitución, que puede ser una simple lista de normas o basarse en fuentes complejas como la Declaración de Derechos Humanos de la ONU.
  2. Fase de aprendizaje por refuerzo: A continuación, el modelo se perfecciona mediante el aprendizaje por refuerzo (RL). En esta fase, la IA genera pares de respuestas y un modelo de preferencias (entrenado con los datos autocríticos de la primera fase) selecciona la que mejor se ajusta a la constitución. Este proceso enseña a la IA a preferir intrínsecamente los resultados que son coherentes con sus principios básicos.

Un ejemplo clave de CAI en el mundo real es su aplicación en Claude, el asistente de IA de Anthropic. Su constitución le guía para que evite generar instrucciones perjudiciales, se niegue a participar en actividades ilegales y se comunique de forma no tóxica, todo ello sin dejar de ser útil. Otra aplicación es la moderación automatizada de contenidos, donde un modelo basado en la CAI podría utilizarse para identificar y marcar el discurso de odio o la desinformación en línea de acuerdo con un conjunto predefinido de directrices éticas.

AI constitucional frente a conceptos afines

Es importante distinguir la CAI de términos similares:

  • Aprendizaje por refuerzo a partir de comentarios humanos (RLHF): El RLHF depende de los humanos para proporcionar retroalimentación y clasificar las respuestas generadas por la IA, lo que requiere mucho tiempo y es difícil de ampliar. CAI sustituye el bucle de retroalimentación humana por otro impulsado por la IA, en el que la constitución del modelo guía la retroalimentación. Esto hace que el proceso de alineación sea más escalable y coherente.
  • Ética de la IA: Se trata de un amplio campo relacionado con los principios morales y los problemas técnicos que plantea la creación de una IA responsable. La IA constitucional puede considerarse un marco práctico para aplicar la ética de la IA mediante la incorporación de normas éticas explícitas directamente en el proceso de formación del modelo.

Aplicaciones y potencial de futuro

En la actualidad, la IA constitucional se aplica principalmente a los LLM para tareas como la generación de diálogos y el resumen de textos. Sin embargo, los principios subyacentes podrían extenderse potencialmente a otros dominios de la IA, incluida la visión por ordenador (CV). Por ejemplo:

El desarrollo y perfeccionamiento de constituciones eficaces, junto con la garantía de que la IA se adhiere fielmente a ellas en diversos contextos, siguen siendo áreas activas de investigación en organizaciones como Google AI y el AI Safety Institute. Herramientas como Ultralytics HUB facilitan la formación y el despliegue de diversos modelos de IA, y la incorporación de principios afines a la IA constitucional será cada vez más importante para garantizar un despliegue responsable de los modelos.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles