Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Integrações

IA Constitucional visa alinhar modelos de IA com valores humanos

Aprenda como a IA constitucional ajuda os modelos a seguir regras éticas, tomar decisões mais seguras e apoiar a justiça em sistemas de linguagem e visão computacional.

ABAbirami Vina
4 min read
IA Constitucional alinhando modelos com valores humanos

A inteligência artificial (IA) está a tornar-se rapidamente numa parte essencial das nossas vidas diárias. Está a ser integrada em ferramentas utilizadas em áreas como saúde, recrutamento, finanças e segurança pública. À medida que estes sistemas se expandem, surgem também preocupações sobre a sua ética e fiabilidade.

Por exemplo, por vezes, sistemas de IA construídos sem considerar a justiça ou a segurança podem produzir resultados que são tendenciosos ou pouco fiáveis. Isto acontece porque muitos modelos ainda não têm uma forma clara de refletir e alinhar-se com os valores humanos.

Para abordar estes desafios, os investigadores estão agora a explorar uma abordagem conhecida como IA constitucional. Simplificando, esta introduz um conjunto escrito de princípios no processo de treino do modelo. Estes princípios ajudam o modelo a avaliar o seu próprio comportamento, a depender menos do feedback humano e a tornar as respostas mais seguras e fáceis de compreender.

Até agora, esta abordagem tem sido utilizada principalmente em relação a grandes modelos de linguagem (LLMs). No entanto, a mesma estrutura poderia ajudar a orientar sistemas de visão computacional a tomar decisões éticas enquanto analisam dados visuais.

Neste artigo, vamos explorar como funciona a IA constitucional, analisar exemplos reais e discutir as suas potenciais aplicações em sistemas de visão computacional.

Características da IA constitucional

Fig 1. Características da IA constitucional. Imagem do autor.

Link to this sectionO que é a IA constitucional?#

A IA constitucional é um método de treino de modelos que orienta o comportamento dos modelos de IA ao fornecer um conjunto claro de regras éticas. Estas regras funcionam como um código de conduta. Em vez de depender do modelo para inferir o que é aceitável, este segue um conjunto escrito de princípios que moldam as suas respostas durante o treino.

Este conceito foi introduzido pela Anthropic, uma empresa de investigação focada na segurança da IA que desenvolveu a família Claude LLM como um método para tornar os sistemas de IA mais auto-supervisionados na sua tomada de decisão.

Em vez de depender apenas do feedback humano, o modelo aprende a criticar e refinar as suas próprias respostas com base num conjunto predefinido de princípios. Esta abordagem é semelhante a um sistema jurídico, onde um juiz recorre a uma constituição antes de tomar uma decisão.

Neste caso, o modelo torna-se tanto o juiz como o estudante, utilizando o mesmo conjunto de regras para rever e refinar o seu próprio comportamento. Este processo fortalece o alinhamento do modelo de IA e apoia o desenvolvimento de sistemas de IA seguros e responsáveis.

Link to this sectionComo funciona a IA constitucional?#

O objetivo da IA constitucional é ensinar um modelo de IA a tomar decisões seguras e justas seguindo um conjunto claro de regras escritas. Aqui tens uma explicação simples de como este processo funciona:

  • Definir a constituição: É criada uma lista escrita de princípios éticos que o modelo deve seguir. A constituição descreve o que a IA deve evitar e que valores deve refletir.
  • Treino com exemplos supervisionados: São mostradas ao modelo respostas de amostra que seguem a constituição. Estes exemplos ajudam a IA a compreender como é um comportamento aceitável.
  • Reconhecer e aplicar padrões: Com o tempo, o modelo começa a captar estes padrões. Aprende a aplicar os mesmos valores ao responder a novas perguntas ou ao lidar com novas situações.
  • Criticar e refinar resultados: O modelo revê as suas próprias respostas e ajusta-as com base na constituição. Esta fase de auto-avaliação ajuda-o a melhorar sem depender apenas do feedback humano.
  • Produzir respostas alinhadas e mais seguras: O modelo aprende com regras consistentes, o que ajuda a reduzir o viés e a melhorar a fiabilidade na utilização no mundo real. Esta abordagem torna-o mais alinhado com os valores humanos e mais fácil de governar.

Uma visão geral sobre o uso de IA constitucional para treinar modelos

Fig 2. Uma visão geral do uso de IA constitucional para treinar modelos.

Link to this sectionPrincípios fundamentais do design de IA ética#

Para que um modelo de IA siga regras éticas, essas regras precisam de ser claramente definidas primeiro. Quando se trata de IA constitucional, estas regras baseiam-se num conjunto de princípios fundamentais.

Por exemplo, aqui estão quatro princípios que constituem a base de uma constituição de IA eficaz:

  • Transparência: Deve ser fácil compreender como um modelo chegou a uma resposta. Se uma resposta se basear em factos, estimativas ou padrões, será transparente para o utilizador. Isto cria confiança e ajuda as pessoas a avaliar se podem confiar nos resultados do modelo.
  • Igualdade: As respostas devem manter-se consistentes entre diferentes utilizadores. O modelo não deve alterar o seu resultado com base no nome, antecedentes ou localização de uma pessoa. A igualdade ajuda a prevenir o viés e promove o tratamento equitativo.
  • Responsabilidade: Deve haver uma forma de rastrear como um modelo foi treinado e o que influenciou o seu comportamento. Quando algo corre mal, as equipas devem ser capazes de identificar a causa e melhorá-la. Isto apoia a transparência e a responsabilidade a longo prazo.
  • Segurança: Os modelos precisam de evitar produzir conteúdo que possa causar danos. Se um pedido levar a resultados arriscados ou inseguros, o sistema deve reconhecê-lo e parar. Isto protege tanto o utilizador como a integridade do sistema.

Link to this sectionExemplos de IA constitucional em grandes modelos de linguagem#

A IA constitucional passou da teoria à prática e está agora a ser utilizada lentamente em grandes modelos que interagem com milhões de utilizadores. Dois dos exemplos mais comuns são os LLMs da OpenAI e da Anthropic.

Embora ambas as organizações tenham adotado abordagens diferentes para criar sistemas de IA mais éticos, partilham uma ideia comum: ensinar o modelo a seguir um conjunto de princípios orientadores escritos. Vamos analisar mais de perto estes exemplos.

Link to this sectionAbordagem de IA constitucional da OpenAI#

A OpenAI introduziu um documento chamado Model Spec como parte do processo de treino para os seus modelos ChatGPT. Este documento funciona como uma constituição. Descreve o que o modelo deve procurar nas suas respostas, incluindo valores como utilidade, honestidade e segurança. Também define o que conta como resultado prejudicial ou enganador.

Esta estrutura tem sido utilizada para ajustar os modelos da OpenAI através da classificação de respostas de acordo com a sua conformidade com as regras. Com o tempo, isto ajudou a moldar o ChatGPT para produzir menos resultados prejudiciais e alinhar-se melhor com o que os utilizadores realmente desejam.

ChatGPT usando a Model Spec da OpenAI para responder

Fig 3. Um exemplo do ChatGPT utilizando o Model Spec da OpenAI para responder.

Link to this sectionModelos de IA ética da Anthropic#

A constituição que o modelo Claude da Anthropic segue baseia-se em princípios éticos de fontes como a Declaração Universal dos Direitos Humanos, diretrizes de plataformas como os termos de serviço da Apple e investigação de outros laboratórios de IA. Estes princípios ajudam a garantir que as respostas do Claude sejam seguras, justas e alinhadas com valores humanos importantes.

O Claude também utiliza Aprendizagem por Reforço a partir de Feedback da IA (RLAIF), onde revê e ajusta as suas próprias respostas com base nestas diretrizes éticas, em vez de depender de feedback humano. Este processo permite que o Claude melhore ao longo do tempo, tornando-o mais escalável e melhor a fornecer respostas úteis, éticas e não prejudiciais, mesmo em situações difíceis.

Compreendendo a abordagem da Anthropic em relação à IA constitucional

Fig 4. Compreender a abordagem da Anthropic à IA constitucional.

Link to this sectionAplicar a IA constitucional à visão computacional#

Uma vez que a IA constitucional está a influenciar positivamente a forma como os modelos de linguagem se comportam, surge naturalmente a questão: Poderia uma abordagem semelhante ajudar os sistemas baseados em visão a responder de forma mais justa e segura?

Embora os modelos de visão computacional trabalhem com imagens em vez de texto, a necessidade de orientação ética é igualmente importante. Por exemplo, a justiça e o viés são fatores-chave a considerar, uma vez que estes sistemas precisam de ser treinados para tratar todos de igual forma e evitar resultados prejudiciais ou injustos ao analisar dados visuais.

Desafios éticos relacionados à visão computacional

Fig 5. Desafios éticos relacionados com a visão computacional. Imagem do autor.

Neste momento, a utilização de métodos de IA constitucional na visão computacional ainda está a ser explorada e encontra-se nas suas fases iniciais, com investigação em curso nesta área.

Por exemplo, a Meta introduziu recentemente o CLUE, uma estrutura que aplica raciocínio semelhante ao constitucional a tarefas de segurança de imagem. Converte regras de segurança amplas em passos precisos que a IA multimodal (sistemas de IA que processam e compreendem múltiplos tipos de dados) pode seguir. Isto ajuda o sistema a raciocinar mais claramente e a reduzir resultados prejudiciais.

Além disso, o CLUE torna os julgamentos de segurança de imagem mais eficientes ao simplificar regras complexas, permitindo que os modelos de IA ajam de forma rápida e precisa sem necessidade de um extenso contributo humano. Ao utilizar um conjunto de princípios orientadores, o CLUE torna os sistemas de moderação de imagem mais escaláveis, garantindo resultados de alta qualidade.

Link to this sectionPrincipais pontos#

À medida que os sistemas de IA assumem mais responsabilidade, o foco está a mudar do que eles podem fazer para o que eles devem fazer. Esta mudança é fundamental, uma vez que estes sistemas são utilizados em áreas que impactam diretamente a vida das pessoas, como saúde, aplicação da lei e educação.

Para garantir que os sistemas de IA ajam de forma apropriada e ética, precisam de uma base sólida e consistente. Esta base deve priorizar a justiça, a segurança e a confiança.

Uma constituição escrita pode fornecer essa base durante o treino, orientando o processo de tomada de decisão do sistema. Também pode dar aos programadores uma estrutura para rever e ajustar o comportamento do sistema após a implementação, garantindo que continua alinhado com os valores que foi concebido para defender e tornando-o mais fácil de adaptar à medida que surgem novos desafios.

Junta-te à nossa comunidade em crescimento hoje mesmo! Aprofunda os teus conhecimentos em IA explorando o nosso repositório GitHub. Queres criar os teus próprios projetos de visão computacional? Explora as nossas opções de licenciamento. Aprende como a visão computacional na saúde está a melhorar a eficiência e explora o impacto da IA no fabrico visitando as nossas páginas de soluções!

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática