Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Guias

Uma introdução ao campo emergente da IA neuro-simbólica

Explore como a IA neuro-simbólica visa combinar aprendizado e lógica para construir sistemas que entendam o contexto e forneçam decisões mais transparentes e explicáveis.

ABAbirami Vina
6 min read
IA neuro-simbólica combinando redes neurais com raciocínio

Atualmente, graças ao rápido crescimento da inteligência artificial (IA) e à disponibilidade crescente de poder computacional, modelos avançados de IA estão sendo lançados mais rapidamente do que nunca. De fato, o espaço de IA está impulsionando inovações significativas em muitos setores.

Por exemplo, na saúde, sistemas de IA estão sendo usados para ajudar em tarefas como a análise de imagens médicas para diagnósticos precoces. No entanto, como qualquer tecnologia, a IA tem suas limitações.

Uma grande preocupação é a transparência. Por exemplo, um modelo de detecção de objetos pode localizar com precisão um tumor em uma ressonância magnética do cérebro, mas pode ser difícil entender como o modelo chegou a essa conclusão. Essa falta de explicabilidade torna mais difícil para médicos e pesquisadores confiar ou validar totalmente os resultados da IA.

É exatamente por isso que há um interesse crescente no campo emergente da IA neuro-simbólica. A IA neuro-simbólica combina os pontos fortes de reconhecimento de padrões do deep learning com o raciocínio estruturado e baseado em regras encontrado na IA simbólica. O objetivo é criar sistemas que façam previsões precisas, mas que também possam explicar seu raciocínio de uma forma que os humanos consigam entender.

Neste artigo, exploraremos como a inteligência artificial neuro-simbólica funciona e como ela une aprendizado e raciocínio para construir sistemas mais transparentes e conscientes do contexto. Vamos começar!

Link to this sectionOs dois lados da IA neuro-simbólica: Aprendizado e raciocínio#

Antes de mergulharmos na IA neuro-simbólica, vamos dar uma olhada mais detalhada nos dois subcampos que ela reúne: deep learning e IA simbólica.

O deep learning foca no reconhecimento de padrões em dados, enquanto a IA simbólica usa regras, lógica ou senso comum para raciocinar sobre problemas. Cada um tem pontos fortes, mas também limitações. Ao combiná-los, a IA neuro-simbólica cria sistemas que conseguem tanto aprender a partir de dados quanto explicar suas decisões com mais clareza.

Link to this sectionUma visão geral do deep learning#

O deep learning é um ramo do aprendizado de máquina que utiliza redes neurais artificiais, vagamente inspiradas na forma como o cérebro processa informações. Essas redes aprendem analisando grandes volumes de dados e ajustando suas conexões internas para melhorar o desempenho.

Isso permite que reconheçam padrões em imagens, sons e textos sem a necessidade de regras criadas manualmente para cada situação. Por causa disso, o deep learning é altamente eficaz para tarefas focadas em percepção, como reconhecimento de imagens, processamento de fala e tradução de idiomas.

Um bom exemplo é um modelo de visão computacional treinado para segmentar objetos em imagens. Com exemplos rotulados suficientes, ele pode aprender a separar estradas, veículos e pedestres em gravações de tráfego em tempo real.

No entanto, apesar da precisão, os modelos de deep learning muitas vezes têm dificuldade em explicar claramente como chegaram a um resultado específico. Esse desafio, comumente referido como o problema da caixa preta, torna mais difícil para os usuários interpretar ou verificar as decisões do modelo, especialmente em áreas sensíveis como saúde ou finanças. Isso é significativo porque uma IA responsável exige transparência, confiança e a capacidade de entender por que um modelo fez uma determinada previsão.

Link to this sectionExplorando a IA simbólica#

A IA simbólica adota uma abordagem mais estruturada para a inteligência e a tomada de decisões. Ela representa o conhecimento usando símbolos e aplica regras lógicas para trabalhar com esse conhecimento, de forma semelhante a como usamos o raciocínio e a linguagem para resolver problemas. Cada etapa no processo de raciocínio é definida, o que torna as decisões da IA simbólica transparentes e mais fáceis de explicar.

O conhecimento simbólico funciona especialmente bem em tarefas que seguem regras claras e bem definidas, como planejamento, agendamento ou gerenciamento de conhecimento estruturado. No entanto, a IA simbólica enfrenta dificuldades com dados não estruturados ou situações que não se encaixam perfeitamente em categorias predefinidas.

Um exemplo comum de abordagens simbólicas em ação são os primeiros programas de xadrez. Eles seguiam regras criadas manualmente e estratégias fixas em vez de aprender com jogos anteriores ou se adaptar a diferentes oponentes. Como resultado, sua jogabilidade tendia a ser rígida e previsível.

Uma visão da estrutura da IA e dos seus subcampos

Fig 1. Um olhar sobre a estrutura da IA e seus subcampos. (Imagem pelo autor)

Link to this sectionO que é IA neuro-simbólica?#

Na década de 2010, à medida que o deep learning se tornou mais amplamente adotado, pesquisadores começaram a buscar maneiras de ir além do simples reconhecimento de padrões e em direção à compreensão de relacionamentos e contexto. Essa mudança tornou possível que os modelos de IA não apenas detectassem objetos em uma cena, como um gato e um tapete, mas também interpretassem como esses objetos se relacionam, como reconhecer que o gato está sentado no tapete.

No entanto, esse progresso também destacou uma limitação central. Os modelos de deep learning podem reconhecer padrões extremamente bem, mas frequentemente têm dificuldade em explicar seu raciocínio ou lidar com situações desconhecidas. Essa atenção renovada ao raciocínio levou os pesquisadores de volta a um campo que existe desde a década de 1980: a IA neuro-simbólica.

A IA neuro-simbólica integra o deep learning e a IA simbólica. Ela permite que os modelos aprendam com exemplos da mesma maneira que o deep learning faz, ao mesmo tempo em que aplica lógica e raciocínio como a IA simbólica faz.

Simplificando, a IA neuro-simbólica pode reconhecer informações, entender o contexto e fornecer explicações mais claras para suas decisões. Essa abordagem nos aproxima do desenvolvimento de sistemas de IA que se comportam de uma maneira mais confiável e humana.

Compreendendo a IA neuro-simbólica

Fig 2. Entendendo a IA Neuro-Simbólica (Imagem pelo autor)

Link to this sectionO básico de como a IA neuro-simbólica funciona#

Uma arquitetura neuro-simbólica une aprendizado e raciocínio dentro de uma única estrutura. Ela geralmente inclui três partes principais: uma camada de percepção neural que interpreta dados brutos, uma camada de raciocínio simbólico que aplica lógica e uma camada de integração que conecta as duas. A seguir, analisaremos cada camada mais de perto.

Link to this sectionA camada de percepção neural#

O componente de percepção neural processa dados não estruturados, como imagens, vídeos, textos ou áudios, e os converte em representações internas com as quais o sistema pode trabalhar. Ele geralmente usa modelos de deep learning para detectar padrões e identificar objetos ou características na entrada. Nesta etapa, o sistema reconhece o que está presente nos dados, mas ainda não raciocina sobre significado, relacionamentos ou contexto.

Aqui estão alguns tipos comuns de modelos de deep learning usados nesta camada:

  • Redes neurais convolucionais (CNNs): São um tipo de rede neural projetada para processar dados em grade, como imagens. As CNNs usam filtros convolucionais para escanear uma imagem e detectar padrões como bordas, texturas e formas. Ao empilhar esses padrões, elas aprendem a reconhecer objetos como carros, frutas e pessoas.
  • Transformers: Os Transformers são modelos projetados para entender como diferentes partes de uma entrada se relacionam entre si. Em vez de ler informações estritamente em ordem, eles podem observar várias partes dos dados ao mesmo tempo e decidir quais partes são mais importantes. Isso ajuda a entender o contexto em texto, imagens ou ambos. Devido a essa flexibilidade, os transformers são a arquitetura central por trás da maioria dos modelos de linguagem modernos e de muitos sistemas de visão e linguagem.
  • Redes neurais recorrentes (RNNs): Este tipo de modelo é projetado para analisar dados sequenciais, como fala ou sinais de séries temporais. Ele mantém uma memória das entradas anteriores, o que significa que suas previsões podem levar em conta o contexto ao longo do tempo.

Por fim, esses modelos neurais extraem e representam características significativas dos dados brutos. Essa saída então se torna a entrada para a camada de raciocínio simbólico, que interpreta e raciocina sobre o que o sistema detectou.

Link to this sectionA camada de raciocínio simbólico#

A camada de raciocínio simbólico pega as informações produzidas pela camada de percepção neural e as interpreta usando lógica. Em vez de trabalhar apenas a partir de padrões, ela se baseia em coisas como regras, grafos de conhecimento, bases de conhecimento e ontologias (descrições organizadas de conceitos e como eles se relacionam entre si). Elas ajudam o sistema a entender como diferentes elementos se encaixam e quais ações fazem sentido em uma determinada situação.

Por exemplo, em um carro autônomo, a camada de percepção neural pode reconhecer um semáforo vermelho no feed da câmera. A camada de raciocínio simbólico pode então aplicar uma regra como: “Se o sinal estiver vermelho, o veículo deve parar”. Como o raciocínio é baseado em regras claras, as decisões do sistema são mais fáceis de explicar e verificar, o que é especialmente importante em situações onde a segurança e a responsabilidade importam.

Link to this sectionA camada de integração#

A camada de integração conecta a camada de percepção neural e a camada de raciocínio simbólico, garantindo que o aprendizado e o raciocínio operem juntos. Em uma direção, ela converte saídas de modelos neurais (como a detecção de um pedestre) em representações simbólicas que descrevem o objeto e seus atributos.

Na outra direção, ela pega regras simbólicas (por exemplo, “um veículo deve parar se um pedestre estiver em uma faixa de pedestres”) e as traduz em sinais que orientam os modelos neurais. Isso pode envolver destacar áreas relevantes de uma imagem, influenciar a atenção ou moldar os caminhos de decisão do modelo.

Essa troca bidirecional forma um ciclo de feedback. O lado neural ganha estrutura e interpretabilidade a partir das regras simbólicas, enquanto o lado simbólico pode se adaptar mais efetivamente com base em dados do mundo real. Técnicas como redes neurais lógicas (LNNs) ajudam a viabilizar essa interação incorporando restrições lógicas diretamente em arquiteturas neurais.

Ao vincular percepção e raciocínio desta maneira, a IA neuro-simbólica pode produzir decisões que são precisas e fáceis de interpretar. Muitos pesquisadores veem essa abordagem como um passo promissor em direção a uma IA mais confiável e alinhada aos humanos, e potencialmente como uma base para o progresso futuro em direção à inteligência artificial geral (AGI).

Link to this sectionAplicações da IA neuro-simbólica#

Agora que temos uma compreensão melhor do que é uma IA neuro-simbólica e como ela funciona, vamos dar uma olhada em alguns dos seus casos de uso no mundo real.

Link to this sectionDirigindo com mais segurança: De ver pedestres a entendê-los#

Veículos autônomos precisam entender seus arredores para operar com segurança. Eles usam tecnologias como visão computacional para detectar pedestres, veículos, marcações de faixa e sinais de trânsito.

Embora os modelos de deep learning consigam identificar esses objetos com precisão, eles nem sempre entendem o que esses objetos significam no contexto ou como se relacionam entre si em uma situação do mundo real. Por exemplo, um modelo neural pode reconhecer um pedestre em uma faixa de pedestres, mas não consegue dizer se ele está prestes a atravessar ou apenas parado esperando.

A IA neuro-simbólica tenta preencher essa lacuna permitindo que veículos autônomos combinem reconhecimento visual com raciocínio lógico, para que possam interpretar situações em vez de apenas identificar objetos. Pesquisas recentes em IA mostraram que sistemas que combinam percepção neural com regras simbólicas podem melhorar a previsão do comportamento de pedestres.

Nesses sistemas, o componente neural analisa pistas visuais como a postura, o movimento e a posição de um pedestre. O componente simbólico então aplica regras lógicas, considerando fatores como se a pessoa está perto de uma faixa de pedestres ou o que o sinal de trânsito atual indica.

Ao combinar essas duas perspectivas, o sistema neuro-simbólico pode fazer mais do que simplesmente detectar um pedestre. Ele pode fazer uma previsão razoável sobre se o pedestre provavelmente atravessará, e pode explicar por que tomou essa decisão. Isso leva a um comportamento mais seguro e transparente em veículos autônomos.

Fazendo previsões baseadas no comportamento observado de pedestres usando IA neuro-simbólica

Fig 3. Fazendo previsões com base no comportamento observado de pedestres usando IA neuro-simbólica. (Fonte)

Link to this sectionInterpretação lógica em perguntas e respostas visuais#

Outra aplicação importante da IA neuro-simbólica é a pergunta e resposta visual (VQA). Os sistemas VQA são projetados para responder a perguntas sobre imagens.

Ela reúne modelos de linguagem grandes (LLMs) e modelos visuais para realizar raciocínio multimodal, combinando o que o sistema vê com o que ele entende. Por exemplo, se um sistema VQA recebe uma imagem e é perguntado: “A xícara está na mesa?”, ele precisa reconhecer os objetos, mas também entender a relação entre eles. Ele precisa determinar se a xícara está realmente localizada em cima da mesa na cena.

Um estudo recente demonstrou como a IA neuro-simbólica pode aprimorar o VQA integrando percepção neural com raciocínio simbólico. No sistema proposto, a rede neural primeiro analisa a imagem para reconhecer objetos e seus atributos, como cor, forma ou tamanho.

O componente de raciocínio simbólico então aplica regras lógicas para interpretar como esses objetos se relacionam entre si e para responder à pergunta. Se for perguntado “Quantos cilindros cinzas há na cena?”, a parte neural identifica todos os cilindros e suas cores, e a parte simbólica os filtra com base nos critérios e conta os corretos.

Exemplos de cenários de VQA onde conhecimento abstrato e lógica são necessários

Fig 4. Exemplos de cenários de VQA onde conhecimento abstrato e lógica são necessários. (Fonte)

Essas pesquisas mostram como o VQA neuro-simbólico pode ir além de apenas fornecer respostas. Como o modelo pode mostrar os passos que tomou para chegar a uma conclusão, ele apoia a IA explicável, onde sistemas fazem previsões e justificam seu raciocínio de uma forma que as pessoas consigam entender.

Link to this sectionPrós e contras da IA neuro-simbólica#

Aqui estão alguns dos principais benefícios de usar a IA neuro-simbólica:

  • Habilidades de raciocínio mais fortes: Ao contrário dos modelos puros de deep learning, a IA neuro-simbólica pode realizar tarefas que exigem raciocínio em várias etapas, planejamento, seguimento de regras e gerenciamento de áreas de conhecimento estruturado, onde a IA simbólica tradicional se destaca.
  • Adaptabilidade: Esses sistemas têm um bom desempenho em tarefas novas ou não vistas, pois conseguem raciocinar logicamente além do que foram treinados. Em vez de apenas memorizar dados, eles entendem relacionamentos e padrões.
  • Robustez a ruídos e ambiguidade: Restrições lógicas podem ajudar a evitar erros quando os dados são ruidosos, incompletos ou ambíguos. A camada de raciocínio pode impor regras que orientam ou corrigem as previsões neurais.

Apesar do seu potencial, a IA neuro-simbólica ainda está evoluindo e traz certos desafios práticos. Aqui estão algumas de suas principais limitações:

  • Integração complexa: Embora essa estrutura híbrida ofereça forte interpretabilidade, projetar algoritmos que mesclem percepção e raciocínio continua sendo um desafio.
  • Escalabilidade: O raciocínio simbólico pode se tornar lento ou computacionalmente caro ao lidar com grandes grafos de conhecimento ou conjuntos de regras complexos. Isso pode tornar aplicações em tempo real, como direção autônoma, processamento de vídeo ou raciocínio de conhecimento em larga escala, mais difíceis de implementar de forma eficiente.
  • Robustez do raciocínio: Se as regras simbólicas forem muito rígidas, os sistemas podem ter dificuldades em cenários ambíguos ou imprevisíveis do mundo real. Equilibrar o aprendizado flexível com o raciocínio confiável ainda é um desafio contínuo.

Link to this sectionPrincipais pontos#

A IA neuro-simbólica representa um passo importante em direção à construção de sistemas de IA que podem não apenas perceber o mundo, mas também raciocinar sobre ele e explicar suas decisões. Ao contrário dos sistemas tradicionais de deep learning, que dependem principalmente de padrões aprendidos a partir de dados, a IA neuro-simbólica combina aprendizado estatístico com lógica estruturada e conhecimento. Em vez de substituir o deep learning, ela constrói sobre ele, nos levando um pouco mais perto do desenvolvimento de uma IA que possa entender e raciocinar de uma maneira mais humana.

Junte-se à nossa comunidade e explore nosso repositório GitHub. Confira nossas páginas de soluções para descobrir várias aplicações de IA na agricultura e visão computacional na saúde. Descubra nossas opções de licenciamento e comece a construir seu projeto de IA visual!

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática