신경-상징 AI라는 새로운 분야에 대한 소개
신경-상징 AI(Neuro-symbolic AI)가 학습과 논리를 결합하여 맥락을 이해하고 더 투명하며 설명 가능한 의사결정을 제공하는 시스템을 구축하는 방법을 알아보세요.

오늘날 인공지능(AI)의 급격한 성장과 컴퓨팅 파워의 가용성 확대로 인해, 첨단 AI 모델이 그 어느 때보다 빠르게 출시되고 있습니다. 실제로 AI 분야는 여러 산업 전반에 걸쳐 의미 있는 혁신을 주도하고 있습니다.
예를 들어, 의료 분야에서는 조기 진단을 위한 의료 영상 분석과 같은 업무를 지원하기 위해 AI 시스템이 사용되고 있습니다. 그러나 모든 기술이 그렇듯, AI에도 한계는 존재합니다.
가장 큰 우려 중 하나는 투명성입니다. 예를 들어, 객체 탐지 모델이 MRI 뇌 스캔 이미지에서 종양을 정확하게 찾아낼 수는 있지만, 모델이 어떻게 그 결론에 도달했는지 이해하기 어려울 수 있습니다. 이러한 설명 가능성의 부족은 의사와 연구자가 AI 결과를 완전히 신뢰하거나 검증하는 것을 어렵게 만듭니다.
바로 이러한 이유로 신흥 분야인 신경 기호 AI에 대한 관심이 커지고 있습니다. 신경 기호 AI는 딥러닝의 패턴 인식 강점과 기호 AI에서 볼 수 있는 구조화된 규칙 기반 추론을 결합합니다. 목표는 정확한 예측을 수행하면서도 사람이 이해할 수 있는 방식으로 추론 과정을 설명할 수 있는 시스템을 만드는 것입니다.
본 글에서는 신경 기호 인공지능이 어떻게 작동하는지, 그리고 어떻게 학습과 추론을 결합하여 더욱 투명하고 상황을 인지하는 시스템을 구축하는지 살펴보겠습니다. 시작해 봅시다!
Link to this section신경 기호 AI의 두 측면: 학습과 추론#
신경 기호 AI에 대해 깊이 알아보기 전에, 이 분야가 결합하는 두 가지 하위 분야인 딥러닝과 기호 AI에 대해 자세히 살펴보겠습니다.
딥러닝은 데이터 내의 패턴을 인식하는 데 집중하는 반면, 기호 AI는 규칙, 논리 또는 상식을 사용하여 문제를 추론합니다. 각각의 장단점이 있습니다. 신경 기호 AI는 이 둘을 결합하여 데이터로부터 학습하고 자신의 결정을 더 명확하게 설명할 수 있는 시스템을 생성합니다.
Link to this section딥러닝 개요#
딥러닝은 뇌가 정보를 처리하는 방식에서 영감을 받은 인공 신경망을 사용하는 머신 러닝의 한 분야입니다. 이러한 네트워크는 방대한 양의 데이터를 분석하고 내부 연결을 조정하여 성능을 개선하는 방식으로 학습합니다.
이를 통해 모든 상황에 대한 수동 규칙 없이도 이미지, 소리, 텍스트 내의 패턴을 인식할 수 있습니다. 이러한 이유로 딥러닝은 이미지 인식, 음성 처리, 언어 번역과 같은 인지 중심 작업에 매우 효과적입니다.
좋은 예로 이미지 속 객체를 세그멘테이션하도록 훈련된 컴퓨터 비전 모델이 있습니다. 충분한 라벨링된 예제를 통해 이 모델은 실시간 교통 영상에서 도로, 차량, 보행자를 분리하는 방법을 학습할 수 있습니다.
그러나 높은 정확도에도 불구하고 딥러닝 모델은 특정 결과에 도달한 과정을 명확히 설명하는 데 어려움을 겪는 경우가 많습니다. 흔히 '블랙박스 문제'라고 불리는 이 도전 과제는 특히 의료나 금융과 같은 민감한 분야에서 사용자가 모델의 결정을 해석하거나 검증하기 어렵게 만듭니다. 책임감 있는 AI를 위해서는 투명성, 신뢰성, 그리고 모델이 왜 특정 예측을 수행했는지 이해할 수 있는 능력이 필요하기 때문에 이는 매우 중요합니다.
Link to this section기호 AI 탐색#
기호 AI는 지능과 의사 결정에 대해 보다 구조화된 접근 방식을 취합니다. 기호를 사용하여 지식을 표현하고 논리 규칙을 적용하여 지식을 처리하는데, 이는 우리가 문제를 해결하기 위해 추론과 언어를 사용하는 방식과 유사합니다. 추론 과정의 각 단계가 정의되어 있어 기호 AI의 결정은 투명하고 설명하기가 더 쉽습니다.
기호 지식은 계획, 스케줄링 또는 구조화된 지식 관리와 같이 명확하고 잘 정의된 규칙을 따르는 작업에서 특히 잘 작동합니다. 그러나 기호 AI는 비정형 데이터나 사전에 정의된 범주에 깔끔하게 들어맞지 않는 상황에서는 어려움을 겪습니다.
기호적 접근 방식이 사용된 일반적인 예로는 초기 체스 프로그램이 있습니다. 이 프로그램들은 이전 게임에서 학습하거나 다른 상대에게 적응하는 대신 수동으로 작성된 규칙과 고정된 전략을 따랐습니다. 결과적으로 게임 플레이는 경직되고 예측 가능한 경향이 있었습니다.

그림 1. AI의 구조와 하위 분야 (이미지 저자 제공)
Link to this section신경 기호 AI란 무엇인가?#
2010년대에 딥러닝이 더 널리 채택되면서 연구자들은 단순한 패턴 인식을 넘어 관계와 맥락을 이해하는 방법을 찾기 시작했습니다. 이러한 변화를 통해 AI 모델은 장면 속의 고양이나 매트와 같은 객체를 감지할 뿐만 아니라, '고양이가 매트 위에 앉아 있다'는 것을 인식하는 것과 같이 객체 간의 관계를 해석할 수 있게 되었습니다.
그러나 이러한 진전은 핵심적인 한계를 드러냈습니다. 딥러닝 모델은 패턴을 매우 잘 인식할 수 있지만, 추론을 설명하거나 익숙하지 않은 상황을 처리하는 데 종종 어려움을 겪습니다. 이러한 추론에 대한 새로운 관심은 연구자들을 1980년대부터 존재해 온 신경 기호 AI라는 분야로 다시 이끌었습니다.
신경 기호 AI는 딥러닝과 기호 AI를 통합합니다. 이를 통해 모델은 딥러닝처럼 예제를 통해 학습하는 동시에 기호 AI처럼 논리와 추론을 적용할 수 있습니다.
간단히 말해, 신경 기호 AI는 정보를 인식하고 맥락을 이해하며 자신의 결정에 대해 더 명확한 설명을 제공할 수 있습니다. 이러한 접근 방식은 더 신뢰할 수 있고 인간과 유사한 방식으로 행동하는 AI 시스템을 개발하는 데 한 걸음 더 다가서게 합니다.

그림 2. 신경 기호 AI 이해하기 (이미지 저자 제공)
Link to this section신경 기호 AI의 작동 원리 기초#
신경 기호 아키텍처는 학습과 추론을 단일 프레임워크 내에서 결합합니다. 일반적으로 세 가지 주요 부분으로 구성됩니다: 원시 데이터를 해석하는 신경 인지 계층, 논리를 적용하는 기호 추론 계층, 그리고 두 계층을 연결하는 통합 계층입니다. 다음으로 각 계층을 자세히 살펴보겠습니다.
Link to this section신경 인지 계층#
신경 인지 구성 요소는 이미지, 비디오, 텍스트 또는 오디오와 같은 비정형 데이터를 처리하고 시스템이 작업할 수 있는 내부 표현으로 변환합니다. 일반적으로 딥러닝 모델을 사용하여 패턴을 감지하고 입력 데이터 내의 객체나 특징을 식별합니다. 이 단계에서 시스템은 데이터에 무엇이 존재하는지 인식하지만, 의미, 관계 또는 맥락에 대해서는 아직 추론하지 않습니다.
다음은 이 계층에서 사용되는 일반적인 딥러닝 모델 유형입니다:
- 합성곱 신경망 (CNNs): 이미지와 같은 그리드 형태의 데이터를 처리하기 위해 설계된 신경망 유형입니다. CNN은 합성곱 필터를 사용하여 이미지를 스캔하고 가장자리, 질감, 모양과 같은 패턴을 감지합니다. 이러한 패턴을 쌓음으로써 자동차, 과일, 사람과 같은 객체를 인식하는 법을 학습합니다.
- 트랜스포머(Transformers): 트랜스포머는 입력 데이터의 서로 다른 부분이 어떻게 연관되는지 이해하도록 설계된 모델입니다. 정보를 엄격하게 순서대로 읽는 대신 데이터의 여러 부분을 동시에 확인하고 어떤 부분이 가장 중요한지 결정할 수 있습니다. 이는 텍스트나 이미지, 또는 둘 다의 맥락을 이해하는 데 도움이 됩니다. 이러한 유연성 덕분에 트랜스포머는 현대의 대부분의 언어 모델과 다수의 비전-언어 시스템의 핵심 아키텍처가 되었습니다.
- 순환 신경망 (RNNs): 이 모델 유형은 음성이나 시계열 신호와 같은 순차적인 데이터를 분석하도록 설계되었습니다. 이전 입력에 대한 메모리를 유지하므로 예측 시 시간 흐름에 따른 맥락을 고려할 수 있습니다.
결과적으로 이러한 신경 모델은 원시 데이터에서 의미 있는 특징을 추출하고 표현합니다. 이 출력은 시스템이 감지한 내용을 해석하고 추론하는 기호 추론 계층의 입력이 됩니다.
Link to this section기호 추론 계층#
기호 추론 계층은 신경 인지 계층이 생성한 정보를 받아 논리를 사용하여 의미를 파악합니다. 단순히 패턴으로 작업하는 대신, 규칙, 지식 그래프, 지식 베이스 및 온톨로지(개념에 대한 조직적인 설명과 그 관계)와 같은 것에 의존합니다. 이는 시스템이 서로 다른 요소들이 어떻게 조화를 이루는지, 주어진 상황에서 어떤 행동이 타당한지 이해하는 데 도움을 줍니다.
예를 들어, 자율주행 자동차의 경우 신경 인지 계층이 카메라 피드에서 빨간색 신호등을 인식할 수 있습니다. 그러면 기호 추론 계층은 '신호등이 빨간색이면 차량은 멈춰야 한다'와 같은 규칙을 적용할 수 있습니다. 추론이 명확한 규칙에 기반하기 때문에 시스템의 결정은 설명하고 검증하기 쉬우며, 이는 안전과 책임이 중요한 상황에서 특히 중요합니다.
Link to this section통합 계층#
통합 계층은 신경 인지 계층과 기호 추론 계층을 연결하여 학습과 추론이 함께 작동하도록 보장합니다. 한 방향으로는 신경 모델의 출력(예: 보행자 감지)을 객체와 그 속성을 설명하는 기호적 표현으로 변환합니다.
반대 방향으로는 기호적 규칙(예: '보행자가 횡단보도에 있으면 차량은 멈춰야 한다')을 받아 신경 모델을 안내하는 신호로 변환합니다. 여기에는 이미지의 관련 영역 강조, 주의 집중 유도 또는 모델의 의사 결정 경로 형성 등이 포함될 수 있습니다.
이러한 양방향 교환은 피드백 루프를 형성합니다. 신경 측은 기호 규칙으로부터 구조와 해석 가능성을 얻고, 기호 측은 실제 데이터를 기반으로 더 효과적으로 적응할 수 있습니다. 논리 신경망(LNNs)과 같은 기술은 논리적 제약 조건을 신경 아키텍처에 직접 내장함으로써 이러한 상호 작용을 가능하게 합니다.
이러한 방식으로 인지와 추론을 연결함으로써 신경 기호 AI는 정확하면서도 해석하기 쉬운 결정을 내릴 수 있습니다. 많은 연구자가 이러한 접근 방식을 더 신뢰할 수 있고 인간과 조화로운 AI를 향한 유망한 단계이자, 인공 일반 지능(AGI)을 향한 미래 발전의 토대로 보고 있습니다.
Link to this section신경 기호 AI의 응용#
이제 신경 기호 AI가 무엇이고 어떻게 작동하는지 더 잘 이해했으니, 실제 사례를 살펴보겠습니다.
Link to this section더 안전한 주행: 보행자 인식에서 이해로#
자율주행 차량은 안전하게 운행하기 위해 주변 환경을 이해해야 합니다. 컴퓨터 비전과 같은 기술을 사용하여 보행자, 차량, 차선 표시 및 교통 표지판을 감지합니다.
딥러닝 모델은 이러한 객체를 정확하게 식별할 수 있지만, 맥락상 그 객체들이 무엇을 의미하는지 또는 실제 상황에서 서로 어떤 관계인지 항상 이해하는 것은 아닙니다. 예를 들어, 신경 모델은 횡단보도의 보행자를 인식할 수는 있지만 그 사람이 건너려는 것인지 아니면 그냥 서서 기다리는 것인지 알 수 없습니다.
신경 기호 AI는 자율주행 차량이 시각적 인식과 논리적 추론을 결합하여 객체를 식별하는 것을 넘어 상황을 해석할 수 있게 함으로써 이러한 격차를 해소하려고 합니다. 최근 AI 연구는 신경 인지와 기호 규칙을 결합한 시스템이 보행자 행동 예측을 개선할 수 있음을 보여주었습니다.
이러한 시스템에서 신경 구성 요소는 보행자의 자세, 움직임, 위치와 같은 시각적 단서를 분석합니다. 그 후 기호 구성 요소는 사람이 횡단보도 근처에 있는지 또는 현재 신호등이 무엇을 나타내는지와 같은 요소를 고려하여 논리 규칙을 적용합니다.
이 두 가지 관점을 결합함으로써 신경 기호 시스템은 단순히 보행자를 감지하는 것 이상의 일을 할 수 있습니다. 보행자가 건널 가능성이 있는지에 대해 합리적인 예측을 할 수 있으며, 왜 그러한 결정을 내렸는지 설명할 수도 있습니다. 이는 자율주행 차량의 행동을 더 안전하고 투명하게 만듭니다.

그림 3. 신경 기호 AI를 사용한 보행자 행동 관찰 기반 예측. (출처)
Link to this section시각적 질의 응답에서의 논리적 해석#
신경 기호 AI의 또 다른 중요한 응용 분야는 시각적 질의 응답(VQA)입니다. VQA 시스템은 이미지에 대한 질문에 답하도록 설계되었습니다.
이 시스템은 거대 언어 모델(LLMs)과 시각 모델을 결합하여 멀티모달 추론을 수행하며, 시스템이 보는 것과 이해하는 것을 결합합니다. 예를 들어, VQA 시스템이 이미지를 보여주고 '탁자 위에 컵이 있나요?'라고 질문받으면, 객체를 인식해야 할 뿐만 아니라 객체 간의 관계도 이해해야 합니다. 장면 속에서 컵이 실제로 탁자 위에 있는지 확인해야 합니다.
최근 한 연구에서는 신경 기호 AI가 신경 인지와 기호 추론을 통합하여 어떻게 VQA를 향상시킬 수 있는지 보여주었습니다. 제안된 시스템에서 신경망은 먼저 이미지를 분석하여 색상, 모양, 크기 등 객체와 그 속성을 인식합니다.
그 후 기호 추론 구성 요소는 논리 규칙을 적용하여 이러한 객체들이 서로 어떤 관계를 맺고 있는지 해석하고 질문에 답변합니다. '장면에 회색 실린더가 몇 개 있나요?'라는 질문을 받으면, 신경 파트는 모든 실린더와 그 색상을 식별하고 기호 파트는 기준에 따라 필터링하여 정확한 수를 계산합니다.

그림 4. 추상적인 지식과 논리가 필요한 VQA 시나리오의 예. (출처)
이러한 연구는 신경 기호 VQA가 단순히 답을 제공하는 수준을 넘어설 수 있음을 보여줍니다. 모델이 결론에 도달하기까지의 단계를 보여줄 수 있기 때문에, 시스템이 예측을 수행하고 그 추론 과정을 사람이 이해할 수 있는 방식으로 정당화하는 설명 가능한 AI를 지원합니다.
Link to this section신경 기호 AI의 장단점#
신경 기호 AI를 사용하는 주요 이점은 다음과 같습니다:
- 강력한 추론 능력: 순수 딥러닝 모델과 달리, 신경 기호 AI는 기호 AI가 전통적으로 강점을 보이는 다단계 추론, 계획, 규칙 준수 및 구조화된 지식 영역 처리가 필요한 작업을 수행할 수 있습니다.
- 적응성: 이러한 시스템은 논리적으로 추론할 수 있기 때문에 훈련된 범위를 넘어선 새로운 작업이나 보지 못한 작업에서도 잘 수행합니다. 단순히 데이터를 암기하는 대신 관계와 패턴을 이해하기 때문입니다.
- 노이즈와 모호성에 대한 견고성: 논리적 제약 조건은 데이터가 노이즈가 많거나 불완전하거나 모호할 때 오류를 방지하는 데 도움이 될 수 있습니다. 추론 계층은 신경 예측을 안내하거나 수정하는 규칙을 적용할 수 있습니다.
잠재력에도 불구하고 신경 기호 AI는 여전히 발전 중이며 몇 가지 실제적인 과제가 따릅니다. 다음은 주요 한계점입니다:
- 복잡한 통합: 이 하이브리드 프레임워크는 강력한 해석 가능성을 제공하지만, 인지와 추론을 결합하는 알고리즘을 설계하는 것은 여전히 어려운 과제입니다.
- 확장성: 대규모 지식 그래프나 복잡한 규칙 세트를 다룰 때 기호 추론은 느려지거나 컴퓨팅 비용이 많이 들 수 있습니다. 이로 인해 자율주행, 비디오 처리 또는 대규모 지식 추론과 같은 실시간 응용 프로그램을 효율적으로 배포하기가 더 어려워질 수 있습니다.
- 추론 견고성: 기호 규칙이 너무 경직되어 있으면 시스템이 모호하거나 예측 불가능한 실제 상황에서 어려움을 겪을 수 있습니다. 유연한 학습과 신뢰할 수 있는 추론 사이의 균형을 맞추는 것은 여전히 진행 중인 과제입니다.
Link to this section핵심 요약#
신경 기호 AI는 세상을 인식할 뿐만 아니라 그에 대해 추론하고 자신의 결정을 설명할 수 있는 AI 시스템을 구축하는 데 중요한 단계를 나타냅니다. 데이터로부터 학습된 패턴에 주로 의존하는 기존 딥러닝 시스템과 달리, 신경 기호 AI는 통계적 학습과 구조화된 논리 및 지식을 결합합니다. 딥러닝을 대체하는 대신 이를 바탕으로 더 인간과 유사한 방식으로 이해하고 추론할 수 있는 AI를 개발하는 데 한 걸음 더 다가서게 합니다.
저희 커뮤니티에 참여하고 GitHub 저장소를 살펴보세요. 농업 AI 및 의료 컴퓨터 비전의 다양한 응용 사례를 확인하시려면 솔루션 페이지를 방문해 보시기 바랍니다. 라이선스 옵션을 알아보고 여러분의 비전 AI 프로젝트 구축을 시작해 보세요!






