IA Constitucional visa alinhar modelos de IA com valores humanos
Aprenda como a IA constitucional ajuda os modelos a seguir regras éticas, tomar decisões mais seguras e apoiar a justiça em sistemas de linguagem e visão computacional.

A inteligência artificial (IA) está a tornar-se rapidamente numa parte essencial das nossas vidas diárias. Está a ser integrada em ferramentas utilizadas em áreas como saúde, recrutamento, finanças e segurança pública. À medida que estes sistemas se expandem, surgem também preocupações sobre a sua ética e fiabilidade.
Por exemplo, por vezes, sistemas de IA construídos sem considerar a justiça ou a segurança podem produzir resultados que são tendenciosos ou pouco fiáveis. Isto acontece porque muitos modelos ainda não têm uma forma clara de refletir e alinhar-se com os valores humanos.
Para abordar estes desafios, os investigadores estão agora a explorar uma abordagem conhecida como IA constitucional. Simplificando, esta introduz um conjunto escrito de princípios no processo de treino do modelo. Estes princípios ajudam o modelo a avaliar o seu próprio comportamento, a depender menos do feedback humano e a tornar as respostas mais seguras e fáceis de compreender.
Até agora, esta abordagem tem sido utilizada principalmente em relação a grandes modelos de linguagem (LLMs). No entanto, a mesma estrutura poderia ajudar a orientar sistemas de visão computacional a tomar decisões éticas enquanto analisam dados visuais.
Neste artigo, vamos explorar como funciona a IA constitucional, analisar exemplos reais e discutir as suas potenciais aplicações em sistemas de visão computacional.

Fig 1. Características da IA constitucional. Imagem do autor.
Link to this sectionO que é a IA constitucional?#
A IA constitucional é um método de treino de modelos que orienta o comportamento dos modelos de IA ao fornecer um conjunto claro de regras éticas. Estas regras funcionam como um código de conduta. Em vez de depender do modelo para inferir o que é aceitável, este segue um conjunto escrito de princípios que moldam as suas respostas durante o treino.
Este conceito foi introduzido pela Anthropic, uma empresa de investigação focada na segurança da IA que desenvolveu a família Claude LLM como um método para tornar os sistemas de IA mais auto-supervisionados na sua tomada de decisão.
Em vez de depender apenas do feedback humano, o modelo aprende a criticar e refinar as suas próprias respostas com base num conjunto predefinido de princípios. Esta abordagem é semelhante a um sistema jurídico, onde um juiz recorre a uma constituição antes de tomar uma decisão.
Neste caso, o modelo torna-se tanto o juiz como o estudante, utilizando o mesmo conjunto de regras para rever e refinar o seu próprio comportamento. Este processo fortalece o alinhamento do modelo de IA e apoia o desenvolvimento de sistemas de IA seguros e responsáveis.
Link to this sectionComo funciona a IA constitucional?#
O objetivo da IA constitucional é ensinar um modelo de IA a tomar decisões seguras e justas seguindo um conjunto claro de regras escritas. Aqui tens uma explicação simples de como este processo funciona:
- Definir a constituição: É criada uma lista escrita de princípios éticos que o modelo deve seguir. A constituição descreve o que a IA deve evitar e que valores deve refletir.
- Treino com exemplos supervisionados: São mostradas ao modelo respostas de amostra que seguem a constituição. Estes exemplos ajudam a IA a compreender como é um comportamento aceitável.
- Reconhecer e aplicar padrões: Com o tempo, o modelo começa a captar estes padrões. Aprende a aplicar os mesmos valores ao responder a novas perguntas ou ao lidar com novas situações.
- Criticar e refinar resultados: O modelo revê as suas próprias respostas e ajusta-as com base na constituição. Esta fase de auto-avaliação ajuda-o a melhorar sem depender apenas do feedback humano.
- Produzir respostas alinhadas e mais seguras: O modelo aprende com regras consistentes, o que ajuda a reduzir o viés e a melhorar a fiabilidade na utilização no mundo real. Esta abordagem torna-o mais alinhado com os valores humanos e mais fácil de governar.

Fig 2. Uma visão geral do uso de IA constitucional para treinar modelos.
Link to this sectionPrincípios fundamentais do design de IA ética#
Para que um modelo de IA siga regras éticas, essas regras precisam de ser claramente definidas primeiro. Quando se trata de IA constitucional, estas regras baseiam-se num conjunto de princípios fundamentais.
Por exemplo, aqui estão quatro princípios que constituem a base de uma constituição de IA eficaz:
- Transparência: Deve ser fácil compreender como um modelo chegou a uma resposta. Se uma resposta se basear em factos, estimativas ou padrões, será transparente para o utilizador. Isto cria confiança e ajuda as pessoas a avaliar se podem confiar nos resultados do modelo.
- Igualdade: As respostas devem manter-se consistentes entre diferentes utilizadores. O modelo não deve alterar o seu resultado com base no nome, antecedentes ou localização de uma pessoa. A igualdade ajuda a prevenir o viés e promove o tratamento equitativo.
- Responsabilidade: Deve haver uma forma de rastrear como um modelo foi treinado e o que influenciou o seu comportamento. Quando algo corre mal, as equipas devem ser capazes de identificar a causa e melhorá-la. Isto apoia a transparência e a responsabilidade a longo prazo.
- Segurança: Os modelos precisam de evitar produzir conteúdo que possa causar danos. Se um pedido levar a resultados arriscados ou inseguros, o sistema deve reconhecê-lo e parar. Isto protege tanto o utilizador como a integridade do sistema.
Link to this sectionExemplos de IA constitucional em grandes modelos de linguagem#
A IA constitucional passou da teoria à prática e está agora a ser utilizada lentamente em grandes modelos que interagem com milhões de utilizadores. Dois dos exemplos mais comuns são os LLMs da OpenAI e da Anthropic.
Embora ambas as organizações tenham adotado abordagens diferentes para criar sistemas de IA mais éticos, partilham uma ideia comum: ensinar o modelo a seguir um conjunto de princípios orientadores escritos. Vamos analisar mais de perto estes exemplos.
Link to this sectionAbordagem de IA constitucional da OpenAI#
A OpenAI introduziu um documento chamado Model Spec como parte do processo de treino para os seus modelos ChatGPT. Este documento funciona como uma constituição. Descreve o que o modelo deve procurar nas suas respostas, incluindo valores como utilidade, honestidade e segurança. Também define o que conta como resultado prejudicial ou enganador.
Esta estrutura tem sido utilizada para ajustar os modelos da OpenAI através da classificação de respostas de acordo com a sua conformidade com as regras. Com o tempo, isto ajudou a moldar o ChatGPT para produzir menos resultados prejudiciais e alinhar-se melhor com o que os utilizadores realmente desejam.

Fig 3. Um exemplo do ChatGPT utilizando o Model Spec da OpenAI para responder.
Link to this sectionModelos de IA ética da Anthropic#
A constituição que o modelo Claude da Anthropic segue baseia-se em princípios éticos de fontes como a Declaração Universal dos Direitos Humanos, diretrizes de plataformas como os termos de serviço da Apple e investigação de outros laboratórios de IA. Estes princípios ajudam a garantir que as respostas do Claude sejam seguras, justas e alinhadas com valores humanos importantes.
O Claude também utiliza Aprendizagem por Reforço a partir de Feedback da IA (RLAIF), onde revê e ajusta as suas próprias respostas com base nestas diretrizes éticas, em vez de depender de feedback humano. Este processo permite que o Claude melhore ao longo do tempo, tornando-o mais escalável e melhor a fornecer respostas úteis, éticas e não prejudiciais, mesmo em situações difíceis.

Fig 4. Compreender a abordagem da Anthropic à IA constitucional.
Link to this sectionAplicar a IA constitucional à visão computacional#
Uma vez que a IA constitucional está a influenciar positivamente a forma como os modelos de linguagem se comportam, surge naturalmente a questão: Poderia uma abordagem semelhante ajudar os sistemas baseados em visão a responder de forma mais justa e segura?
Embora os modelos de visão computacional trabalhem com imagens em vez de texto, a necessidade de orientação ética é igualmente importante. Por exemplo, a justiça e o viés são fatores-chave a considerar, uma vez que estes sistemas precisam de ser treinados para tratar todos de igual forma e evitar resultados prejudiciais ou injustos ao analisar dados visuais.

Fig 5. Desafios éticos relacionados com a visão computacional. Imagem do autor.
Neste momento, a utilização de métodos de IA constitucional na visão computacional ainda está a ser explorada e encontra-se nas suas fases iniciais, com investigação em curso nesta área.
Por exemplo, a Meta introduziu recentemente o CLUE, uma estrutura que aplica raciocínio semelhante ao constitucional a tarefas de segurança de imagem. Converte regras de segurança amplas em passos precisos que a IA multimodal (sistemas de IA que processam e compreendem múltiplos tipos de dados) pode seguir. Isto ajuda o sistema a raciocinar mais claramente e a reduzir resultados prejudiciais.
Além disso, o CLUE torna os julgamentos de segurança de imagem mais eficientes ao simplificar regras complexas, permitindo que os modelos de IA ajam de forma rápida e precisa sem necessidade de um extenso contributo humano. Ao utilizar um conjunto de princípios orientadores, o CLUE torna os sistemas de moderação de imagem mais escaláveis, garantindo resultados de alta qualidade.
Link to this sectionPrincipais pontos#
À medida que os sistemas de IA assumem mais responsabilidade, o foco está a mudar do que eles podem fazer para o que eles devem fazer. Esta mudança é fundamental, uma vez que estes sistemas são utilizados em áreas que impactam diretamente a vida das pessoas, como saúde, aplicação da lei e educação.
Para garantir que os sistemas de IA ajam de forma apropriada e ética, precisam de uma base sólida e consistente. Esta base deve priorizar a justiça, a segurança e a confiança.
Uma constituição escrita pode fornecer essa base durante o treino, orientando o processo de tomada de decisão do sistema. Também pode dar aos programadores uma estrutura para rever e ajustar o comportamento do sistema após a implementação, garantindo que continua alinhado com os valores que foi concebido para defender e tornando-o mais fácil de adaptar à medida que surgem novos desafios.
Junta-te à nossa comunidade em crescimento hoje mesmo! Aprofunda os teus conhecimentos em IA explorando o nosso repositório GitHub. Queres criar os teus próprios projetos de visão computacional? Explora as nossas opções de licenciamento. Aprende como a visão computacional na saúde está a melhorar a eficiência e explora o impacto da IA no fabrico visitando as nossas páginas de soluções!






