O domínio emergente da IA neuro-simbólica: uma introdução

Atualmente, graças ao rápido crescimento da inteligência artificial (IA) e à crescente disponibilidade de capacidade de computação, os modelos avançados de IA estão a ser lançados mais rapidamente do que nunca. De facto, o espaço da IA está a impulsionar uma inovação significativa em muitas indústrias.

Por exemplo, nos cuidados de saúde, os sistemas de IA estão a ser utilizados para ajudar em tarefas como a análise de imagens médicas para um diagnóstico precoce. No entanto, como qualquer tecnologia, a IA tem as suas limitações.

Uma das principais preocupações é a transparência. Por exemplo, um modelo de deteção de objectos pode localizar com precisão um tumor numa ressonância magnética do cérebro, mas pode ser difícil compreender como é que o modelo chegou a essa conclusão. Esta falta de explicação faz com que seja mais difícil para os médicos e investigadores confiarem plenamente ou validarem os resultados da IA.

É exatamente por isso que há um interesse crescente no domínio emergente da IA neuro-simbólica. A IA neuro-simbólica combina os pontos fortes de reconhecimento de padrões da aprendizagem profunda com o raciocínio estruturado e baseado em regras encontrado na IA simbólica. O objetivo é criar sistemas que façam previsões precisas, mas que também possam explicar o seu raciocínio de uma forma que os humanos possam compreender.

Neste artigo, vamos explorar a forma como a inteligência artificial neuro-simbólica funciona e como junta a aprendizagem e o raciocínio para construir sistemas mais transparentes e conscientes do contexto. Vamos lá começar!

As duas faces da IA neuro-simbólica: aprendizagem e raciocínio

Antes de nos debruçarmos sobre a IA neuro-simbólica, vamos analisar mais de perto os dois subcampos que esta reúne: aprendizagem profunda e IA simbólica.

A aprendizagem profunda centra-se no reconhecimento de padrões nos dados, enquanto a IA simbólica utiliza regras, lógica ou senso comum para resolver problemas. Cada uma delas tem pontos fortes, mas também limitações. Ao combiná-los, a IA neuro-simbólica cria sistemas que podem aprender com os dados e explicar as suas decisões de forma mais clara.

Uma visão geral da aprendizagem profunda

A aprendizagem profunda é um ramo da aprendizagem automática que utiliza redes neuronais artificiais, vagamente inspiradas na forma como o cérebro processa a informação. Estas redes aprendem através da análise de grandes quantidades de dados e ajustam as suas ligações internas para melhorar o desempenho.

Isto permite-lhes reconhecer padrões em imagens, sons e texto sem necessitarem de regras criadas manualmente para cada situação. Por este motivo, a aprendizagem profunda é altamente eficaz para tarefas centradas na perceção, como o reconhecimento de imagens, o processamento da fala e a tradução de línguas.

Um bom exemplo é um modelo de visão por computador treinado para segment objectos em imagens. Com exemplos rotulados suficientes, pode aprender a separar estradas, veículos e peões em imagens de trânsito em tempo real.

No entanto, apesar da sua precisão, os modelos de aprendizagem profunda têm muitas vezes dificuldade em explicar claramente como chegaram a um resultado específico. Este desafio, normalmente referido como o problema da caixa negra, torna mais difícil para os utilizadores interpretar ou verificar as decisões do modelo, especialmente em áreas sensíveis como os cuidados de saúde ou as finanças. É importante porque a IA responsável exige transparência, confiança e a capacidade de compreender porque é que um modelo fez uma determinada previsão.

Explorar a IA simbólica

A IA simbólica adopta uma abordagem mais estruturada da inteligência e da tomada de decisões. Representa o conhecimento através de símbolos e aplica regras lógicas para trabalhar com esse conhecimento, à semelhança da forma como utilizamos o raciocínio e a linguagem para resolver problemas. Cada etapa do processo de raciocínio é definida, o que torna as decisões da IA simbólica transparentes e mais fáceis de explicar.

O conhecimento simbólico funciona especialmente bem em tarefas que seguem regras claras e bem definidas, como o planeamento, a programação ou a gestão de conhecimentos estruturados. No entanto, a IA simbólica tem dificuldade em lidar com dados não estruturados ou situações que não se enquadram perfeitamente em categorias predefinidas.

Um exemplo comum de abordagens simbólicas em ação são os primeiros programas de xadrez. Estes programas seguiam regras criadas à mão e estratégias fixas em vez de aprenderem com jogos anteriores ou de se adaptarem a adversários diferentes. Como resultado, a sua jogabilidade tendia a ser rígida e previsível.

Figura 1. Uma visão da estrutura da IA e dos seus subdomínios. (Imagem do autor)

‍

O que é a IA neuro-simbólica?

Na década de 2010, à medida que a aprendizagem profunda se tornou mais amplamente adoptada, os investigadores começaram a procurar formas de ir além do simples reconhecimento de padrões e de compreender as relações e o contexto. Esta mudança tornou possível que os modelos de IA não só detect objectos numa cena, como um gato e um tapete, mas também interpretassem a forma como esses objectos se relacionam, por exemplo, reconhecendo que o gato está sentado no tapete.

No entanto, este progresso também evidenciou uma limitação fundamental. Os modelos de aprendizagem profunda conseguem reconhecer padrões extremamente bem, mas muitas vezes têm dificuldade em explicar o seu raciocínio ou em lidar com situações desconhecidas. Esta atenção renovada ao raciocínio levou os investigadores de volta a um campo que existe desde os anos 80: a IA neuro-simbólica.

A IA neuro-simbólica integra a aprendizagem profunda e a IA simbólica. Permite que os modelos aprendam a partir de exemplos da mesma forma que a aprendizagem profunda, ao mesmo tempo que aplicam a lógica e o raciocínio como faz a IA simbólica.

Em termos simples, a IA neuro-simbólica pode reconhecer informação, compreender o contexto e fornecer explicações mais claras para as suas decisões. Esta abordagem aproxima-nos do desenvolvimento de sistemas de IA que se comportam de uma forma mais fiável e semelhante à humana.

Fig. 2. Compreender a IA neuro-simbólica (Imagem do autor)

‍

Noções básicas sobre o funcionamento da IA neuro-simbólica

As arquitecturas neuro-simbólicas reúnem a aprendizagem e o raciocínio num único quadro. Normalmente, inclui três partes principais: uma camada de perceção neural que interpreta dados em bruto, uma camada de raciocínio simbólico que aplica a lógica e uma camada de integração que liga as duas. De seguida, vamos analisar mais detalhadamente cada camada.

A camada de perceção neural

O componente de perceção neural processa dados não estruturados, como imagens, vídeo, texto ou áudio, e converte-os em representações internas com as quais o sistema pode trabalhar. Normalmente, utiliza modelos de aprendizagem profunda para detect padrões e identificar objectos ou caraterísticas na entrada. Nesta fase, o sistema reconhece o que está presente nos dados, mas ainda não raciocina sobre o significado, as relações ou o contexto.

Eis alguns tipos comuns de modelos de aprendizagem profunda utilizados nesta camada:

Redes neurais convolucionais (CNNs): São um tipo de rede neural concebida para processar dados em forma de grelha, como imagens. As CNNs utilizam filtros convolucionais para percorrer uma imagem e detect padrões como arestas, texturas e formas. Ao empilhar estes padrões, aprendem a reconhecer objectos como carros, frutas e pessoas.
‍
Transformadores: Os transformadores são modelos concebidos para compreender a forma como as diferentes partes de uma entrada se relacionam entre si. Em vez de lerem a informação estritamente por ordem, podem olhar para várias partes dos dados ao mesmo tempo e decidir quais as partes mais importantes. Isto ajuda-os a compreender o contexto do texto, das imagens ou de ambos. Devido a esta flexibilidade, os transformadores são a arquitetura central subjacente à maioria dos modelos de linguagem modernos e a muitos sistemas de visão-linguagem.
‍
Redes neuronais recorrentes (RNNs): Este tipo de modelo foi concebido para analisar dados sequenciais, como a fala ou sinais de séries temporais. Mantém uma memória de entradas anteriores, o que significa que as suas previsões podem ter em conta o contexto ao longo do tempo.

Em última análise, estes modelos neurais extraem e representam caraterísticas significativas a partir de dados brutos. Esta saída torna-se então a entrada para a camada de raciocínio simbólico, que interpreta e raciocina sobre o que o sistema detectou.

A camada de raciocínio simbólico

A camada de raciocínio simbólico pega na informação produzida pela camada de perceção neural e dá-lhe sentido utilizando a lógica. Em vez de trabalhar apenas com padrões, baseia-se em coisas como regras, gráficos de conhecimento, bases de conhecimento e ontologias (descrições organizadas de conceitos e da forma como se relacionam entre si). Estas ajudam o sistema a compreender como os diferentes elementos se encaixam e que acções fazem sentido numa determinada situação.

Por exemplo, num carro autónomo, a camada de perceção neural pode reconhecer um semáforo vermelho no feed da câmara. A camada de raciocínio simbólico pode então aplicar uma regra como: "Se o semáforo estiver vermelho, o veículo deve parar". Como o raciocínio é baseado em regras claras, as decisões do sistema são mais fáceis de explicar e verificar, o que é especialmente importante em situações em que a segurança e a responsabilidade são importantes.

O nível de integração

A camada de integração liga a camada de perceção neural e a camada de raciocínio simbólico, assegurando que a aprendizagem e o raciocínio funcionam em conjunto. Numa direção, converte os resultados dos modelos neurais (como a deteção de um peão) em representações simbólicas que descrevem o objeto e os seus atributos.

Na outra direção, pega em regras simbólicas (por exemplo, "um veículo tem de parar se um peão estiver numa passadeira") e traduz-nas em sinais que orientam os modelos neuronais. Isto pode implicar destacar áreas relevantes de uma imagem, influenciar a atenção ou moldar as vias de decisão do modelo.

Este intercâmbio bidirecional forma um ciclo de feedback. O lado neural ganha estrutura e interpretabilidade a partir de regras simbólicas, enquanto o lado simbólico pode adaptar-se mais eficazmente com base em dados do mundo real. Técnicas como as redes neuronais lógicas (LNN) ajudam a permitir esta interação, incorporando restrições lógicas diretamente nas arquitecturas neuronais.

Ao associar a perceção e o raciocínio desta forma, a IA neuro-simbólica pode produzir decisões que são simultaneamente exactas e fáceis de interpretar. Muitos investigadores vêem esta abordagem como um passo promissor no sentido de uma IA mais fiável e mais alinhada com o ser humano e, potencialmente, como uma base para futuros progressos no sentido da inteligência artificial geral (AGI).

Aplicações da IA neuro-simbólica

Agora que compreendemos melhor o que é uma IA neuro-simbólica e como funciona, vamos analisar alguns dos seus casos de utilização no mundo real.

Conduzir com mais segurança: Desde ver os peões até compreendê-los

Os veículos autónomos precisam de compreender o que os rodeia para funcionarem em segurança. Utilizam tecnologias como a visão por computador para detect peões, veículos, marcas de faixa de rodagem e sinais de trânsito.

Embora os modelos de aprendizagem profunda possam identificar estes objectos com precisão, nem sempre compreendem o significado desses objectos no contexto ou como se relacionam entre si numa situação do mundo real. Por exemplo, um modelo neural pode reconhecer um peão numa passadeira, mas não consegue perceber se está prestes a atravessar ou se está apenas parado e à espera.

A IA neuro-simbólica tenta colmatar esta lacuna, permitindo que os veículos autónomos combinem o reconhecimento visual com o raciocínio lógico, para que possam interpretar situações em vez de se limitarem a identificar objectos. A investigação recente no domínio da IA demonstrou que os sistemas que combinam a perceção neural com regras simbólicas podem melhorar a previsão do comportamento dos peões.

Nestes sistemas, o componente neural analisa pistas visuais, como a postura, o movimento e a posição de um peão. O componente simbólico aplica então regras lógicas, considerando factores como se a pessoa está perto de uma passadeira ou o que o sinal de trânsito atual indica.

Ao combinar estas duas perspectivas, o sistema neuro-simbólico pode fazer mais do que simplesmente detect um peão. Pode fazer uma previsão razoável sobre a probabilidade de o peão atravessar a rua e pode explicar por que razão tomou essa decisão. Isto conduz a um comportamento mais seguro e mais transparente nos veículos autónomos.

Fig. 3. Fazer previsões com base no comportamento observado dos peões utilizando IA neuro-simbólica.(Fonte)

‍

Interpretação lógica na resposta a perguntas visuais

Outra aplicação importante da IA neuro-simbólica é a resposta a perguntas visuais (VQA). Os sistemas de VQA são concebidos para responder a perguntas sobre imagens.

Reúne modelos de grande linguagem (LLMs) e modelos visuais para efetuar raciocínios multimodais, combinando o que o sistema vê com o que compreende. Por exemplo, se for mostrada uma imagem a um sistema VQA e lhe for perguntado "A chávena está em cima da mesa?", tem de reconhecer os objectos mas também compreender a relação entre eles. Tem de determinar se a chávena está efetivamente localizada em cima da mesa na cena.

Um estudo recente demonstrou como a IA neuro-simbólica pode melhorar a VQA através da integração da perceção neural com o raciocínio simbólico. No sistema proposto, a rede neural analisa primeiro a imagem para reconhecer objectos e os seus atributos, como a cor, a forma ou o tamanho.

A componente de raciocínio simbólico aplica então regras lógicas para interpretar a forma como estes objectos se relacionam entre si e para responder à pergunta. Se lhe for perguntado "Quantos cilindros cinzentos existem na cena?", a parte neural identifica todos os cilindros e as suas cores, e a parte simbólica filtra-os com base nos critérios e conta os corretos.

Fig. 4. Exemplos de cenários de VQA em que são necessários conhecimentos abstractos e lógicos.(Fonte)

‍

Esta investigação mostra como a VQA neuro-simbólica pode ir além do simples fornecimento de respostas. Uma vez que o modelo pode mostrar os passos que deu para chegar a uma conclusão, apoia a IA explicável, em que os sistemas fazem previsões e justificam o seu raciocínio de uma forma que as pessoas possam compreender.

Prós e contras da IA neuro-simbólica

Eis algumas das principais vantagens da utilização da IA neuro-simbólica:

Capacidades de raciocínio mais fortes: Ao contrário dos modelos de aprendizagem profunda pura, a IA neuro-simbólica pode realizar tarefas que requerem raciocínio em várias etapas, planeamento, seguimento de regras e manipulação de áreas de conhecimento estruturadas, onde a IA simbólica tradicionalmente se destaca.
‍
Adaptabilidade: Estes sistemas têm um bom desempenho em tarefas novas ou inéditas, uma vez que conseguem raciocinar logicamente para além daquilo em que foram treinados. Em vez de se limitarem a memorizar dados, compreendem relações e padrões.
‍
Robustez face ao ruído e à ambiguidade: As restrições lógicas podem ajudar a evitar erros quando os dados são ruidosos, incompletos ou ambíguos. A camada de raciocínio pode aplicar regras que orientam ou corrigem as previsões neurais.

Apesar do seu potencial, a IA neuro-simbólica ainda está a evoluir e apresenta alguns desafios práticos. Eis algumas das suas principais limitações:

Integração complexa: Embora esta estrutura híbrida ofereça uma forte capacidade de interpretação, a conceção de algoritmos que fundam a perceção e o raciocínio continua a ser um desafio.
‍
Escalabilidade: O raciocínio simbólico pode tornar-se lento ou computacionalmente dispendioso quando se lida com grandes gráficos de conhecimento ou conjuntos de regras complexos. Isto pode tornar as aplicações em tempo real, como a condução autónoma, o processamento de vídeo ou o raciocínio de conhecimento em grande escala, mais difíceis de implementar de forma eficiente.
‍
Robustez do raciocínio: Se as regras simbólicas forem demasiado rígidas, os sistemas podem ter dificuldades em cenários ambíguos ou imprevisíveis do mundo real. O equilíbrio entre uma aprendizagem flexível e um raciocínio fiável continua a ser um desafio permanente.

Principais conclusões

A IA neuro-simbólica representa um passo importante para a criação de sistemas de IA que possam não só perceber o mundo, mas também raciocinar sobre ele e explicar as suas decisões. Ao contrário dos sistemas tradicionais de aprendizagem profunda, que se baseiam principalmente em padrões aprendidos a partir de dados, a IA neuro-simbólica combina a aprendizagem estatística com lógica e conhecimento estruturados. Em vez de substituir a aprendizagem profunda, baseia-se nela, aproximando-nos um pouco mais do desenvolvimento de uma IA capaz de compreender e raciocinar de uma forma mais humana.

Junte-se à nossa comunidade e explore o nosso repositório GitHub. Consulte as nossas páginas de soluções para descobrir várias aplicações de IA na agricultura e de visão computacional nos cuidados de saúde. Descubra as nossas opções de licenciamento e comece a construir o seu projeto de IA de visão!

Uma introdução ao domínio emergente da IA neuro-simbólica