Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

IA Constitucional

Descubra como a IA Constitucional garante saídas de IA éticas, seguras e imparciais, alinhando modelos com princípios predefinidos e valores humanos.

A IA Constitucional (CAI) é um método desenvolvido pela Anthropic para treinar modelos de IA, particularmente Modelos de Linguagem Grandes (LLMs), para se alinharem com um conjunto específico de regras ou princípios, conhecido como "constituição". O principal objetivo da CAI é tornar os sistemas de IA úteis, inofensivos e mais controláveis sem exigir um feedback humano extensivo. Em vez de humanos rotularem constantemente resultados prejudiciais, a IA aprende a criticar e a rever as suas próprias respostas com base nos princípios orientadores da sua constituição. Esta abordagem ajuda a resolver desafios-chave na ética da IA, como a prevenção da geração de conteúdo tóxico e a redução do viés algorítmico.

Como Funciona a IA Constitucional

O processo de treinamento de CAI normalmente envolve duas fases principais:

  1. Fase de Aprendizado Supervisionado: Inicialmente, um modelo de base é solicitado a gerar respostas. Em seguida, o mesmo modelo é solicitado a criticar suas próprias respostas com base na constituição e reescrevê-las para melhor se alinhar com seus princípios. Isso cria um novo conjunto de dados de exemplos aprimorados e alinhados à constituição. Este mecanismo de autocrítica é guiado por uma constituição, que pode ser uma simples lista de regras ou extrair de fontes complexas como a Declaração Universal dos Direitos Humanos da ONU.
  2. Fase de Aprendizado por Reforço: O modelo é então ajustado usando Aprendizado por Reforço (RL). Nesta etapa, a IA gera pares de respostas, e um modelo de preferência (treinado nos dados auto-criticados da primeira fase) seleciona aquele que melhor adere à constituição. Este processo ensina a IA a preferir intrinsecamente saídas que sejam consistentes com seus princípios básicos.

Um exemplo chave do mundo real de CAI é a sua implementação no assistente de IA da Anthropic, Claude. A sua constituição o orienta a evitar gerar instruções prejudiciais, recusar-se a envolver-se em atividades ilegais e comunicar de forma não tóxica, tudo isso permanecendo útil. Outra aplicação é na moderação automatizada de conteúdo, onde um modelo orientado por CAI poderia ser usado para identificar e sinalizar discurso de ódio ou desinformação online de acordo com um conjunto predefinido de diretrizes éticas.

IA Constitucional vs. Conceitos Relacionados

É importante distinguir a CAI de termos semelhantes:

  • Aprendizado por Reforço a partir de Feedback Humano (RLHF): O RLHF depende de humanos para fornecer feedback e classificar as respostas geradas por IA, o que consome tempo e é difícil de escalar. O CAI substitui o loop de feedback humano por um loop orientado por IA, onde a constituição do modelo orienta o feedback. Isso torna o processo de alinhamento mais escalável e consistente.
  • Ética em IA: Este é um campo amplo que se preocupa com os princípios morais e os problemas técnicos da criação de IA responsável. A IA Constitucional pode ser vista como uma estrutura prática para implementar a ética em IA, incorporando regras éticas explícitas diretamente no processo de treinamento do modelo.

Aplicações e Potencial Futuro

Atualmente, a IA Constitucional é aplicada principalmente a LLMs para tarefas como geração de diálogo e resumo de texto. No entanto, os princípios subjacentes podem potencialmente se estender a outros domínios de IA, incluindo a Visão Computacional (CV). Por exemplo:

O desenvolvimento e o aprimoramento de constituições eficazes, juntamente com a garantia de que a IA adere fielmente a elas em diversos contextos, permanecem áreas ativas de pesquisa em organizações como o Google AI e o AI Safety Institute. Ferramentas como o Ultralytics HUB facilitam o treinamento e a implementação de vários modelos de IA, e a incorporação de princípios semelhantes à IA Constitucional se tornará cada vez mais importante para garantir a implementação responsável de modelos.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora
Link copiado para a área de transferência