새롭게 떠오르는 신경 기호 AI 분야: 소개

오늘날 인공지능(AI) 의 급속한 성장과 컴퓨팅 성능의 향상으로 인해 그 어느 때보다 빠르게 고급 AI 모델이 출시되고 있습니다. 실제로 AI 분야는 여러 산업 분야에서 의미 있는 혁신을 주도하고 있습니다.

예를 들어, 의료 분야에서는 조기 진단을 위한 의료 이미지 분석과 같은 작업을 지원하는 데 AI 시스템이 사용되고 있습니다. 하지만 다른 기술과 마찬가지로 AI에도 한계가 있습니다.

한 가지 주요 관심사는 투명성입니다. 예를 들어, 물체 감지 모델이 MRI 뇌 스캔에서 종양의 위치를 정확하게 찾아낼 수 있지만, 그 모델이 어떻게 그런 결론에 도달했는지 이해하기 어려울 수 있습니다. 이러한 설명 가능성 부족은 의사와 연구자가 AI 결과를 완전히 신뢰하거나 검증하기 어렵게 만듭니다.

바로 이 때문에 새롭게 떠오르는 신경 기호 AI 분야에 대한 관심이 높아지고 있습니다. 신경 기호 AI는 딥러닝의 패턴 인식 강점과 기호 AI의 구조화된 규칙 기반 추론을 결합한 것입니다. 정확한 예측을 하면서도 그 추론을 인간이 이해할 수 있는 방식으로 설명할 수 있는 시스템을 만드는 것이 목표입니다.

이 글에서는 신경 기호 인공 지능의 작동 방식과 학습과 추론을 결합하여 보다 투명하고 맥락을 인식하는 시스템을 구축하는 방법에 대해 살펴봅니다. 시작해 보겠습니다!

신경 기호 AI의 두 가지 측면: 학습과 추론

뉴로 심볼릭 AI에 대해 자세히 알아보기 전에 딥러닝과 심볼릭 AI라는 두 가지 하위 분야에 대해 자세히 살펴보겠습니다.

딥러닝은 데이터의 패턴을 인식하는 데 중점을 두는 반면, 기호적 AI는 규칙, 논리 또는 상식을 사용하여 문제를 추론합니다. 각기 강점이 있지만 한계도 있습니다. 이 두 가지를 결합하여 신경 기호 AI는 데이터로부터 학습하고 결정을 더 명확하게 설명할 수 있는 시스템을 만듭니다.

딥 러닝 개요

딥 러닝은 인공 신경망을 사용하는 머신 러닝의 한 분야로, 두뇌가 정보를 처리하는 방식에서 느슨하게 영감을 받았습니다. 이러한 네트워크는 대량의 데이터를 분석하고 내부 연결을 조정하여 성능을 개선함으로써 학습합니다.

이를 통해 모든 상황에 대해 수작업으로 규칙을 만들 필요 없이 이미지, 소리, 텍스트의 패턴을 인식할 수 있습니다. 따라서 딥러닝은 이미지 인식, 음성 처리, 언어 번역과 같이 인식에 중점을 둔 작업에 매우 효과적입니다.

좋은 예로 이미지에서 객체를 segment 훈련된 컴퓨터 비전 모델을 들 수 있습니다. 레이블이 지정된 충분한 예제를 통해 실시간 교통 영상에서 도로, 차량, 보행자를 구분하는 방법을 학습할 수 있습니다.

그러나 딥러닝 모델은 정확성에도 불구하고 특정 결과에 도달한 방법을 명확하게 설명하는 데 어려움을 겪는 경우가 많습니다. 흔히 블랙박스 문제라고 불리는 이 문제는 특히 의료나 금융과 같은 민감한 영역에서 사용자가 모델의 결정을 해석하거나 검증하는 것을 어렵게 만듭니다. 책임감 있는 AI는 투명성과 신뢰, 그리고 모델이 특정 예측을 한 이유를 이해할 수 있는 능력을 필요로 하기 때문에 이 문제는 매우 중요합니다.

심볼릭 AI 살펴보기

기호 AI는 지능과 의사 결정에 대해 보다 구조화된 접근 방식을 취합니다. 우리가 추론과 언어를 사용해 문제를 해결하는 방식과 유사하게 기호로 지식을 표현하고 논리적 규칙을 적용하여 해당 지식으로 작업합니다. 추론 과정의 각 단계가 정의되어 있어 기호 AI의 결정을 투명하고 쉽게 설명할 수 있습니다.

기호적 지식은 계획, 일정 관리, 구조화된 지식 관리와 같이 명확하고 잘 정의된 규칙을 따르는 작업에서 특히 효과적입니다. 그러나 기호적 AI는 구조화되지 않은 데이터나 미리 정의된 범주에 깔끔하게 들어맞지 않는 상황에서는 어려움을 겪습니다.

상징적 접근법의 일반적인 예는 초기 체스 프로그램입니다. 그들은 이전 게임에서 학습하거나 다른 상대에게 적응하기보다는 수작업으로 만든 규칙과 고정된 전략을 따랐습니다. 그 결과 게임 플레이가 경직되고 예측 가능한 경향이 있었습니다.

그림 1. AI의 구조와 그 하위 분야를 살펴봅니다. (이미지 제공: 저자)

‍

신경심리학적 AI란 무엇인가요?

2010년대 들어 딥러닝이 널리 채택되면서 연구자들은 단순한 패턴 인식을 넘어 관계와 맥락을 이해하는 방향으로 나아갈 방법을 모색하기 시작했습니다. 이러한 변화로 인해 AI 모델은 고양이와 매트와 같은 장면 속 사물을 detect 뿐만 아니라 고양이가 매트 위에 앉아 있음을 인식하는 등 이러한 사물의 관계를 해석할 수 있게 되었습니다.

그러나 이러한 발전은 핵심적인 한계를 드러내기도 했습니다. 딥러닝 모델은 패턴을 매우 잘 인식할 수 있지만, 추론을 설명하거나 익숙하지 않은 상황을 처리하는 데 어려움을 겪는 경우가 많습니다. 추론에 대한 새로운 관심은 연구자들을 1980년대부터 존재해 온 신경 기호 AI라는 분야로 다시 이끌었습니다.

뉴로 심볼릭 AI는 딥러닝과 심볼릭 AI를 통합합니다. 이를 통해 모델은 딥러닝과 동일한 방식으로 예제를 통해 학습하는 동시에 심볼릭 AI처럼 논리와 추론을 적용할 수 있습니다.

간단히 말해, 신경 기호 AI는 정보를 인식하고, 문맥을 이해하고, 결정에 대한 보다 명확한 설명을 제공할 수 있습니다. 이러한 접근 방식을 통해 보다 안정적이고 인간과 유사한 방식으로 작동하는 AI 시스템을 개발하는 데 더 가까워질 수 있습니다.

‍

신경 기호 AI 작동 방식의 기본 사항

신경 기호 아키텍처는 학습과 추론을 단일 프레임워크 내에서 통합합니다. 일반적으로 원시 데이터를 해석하는 신경 인식 계층, 논리를 적용하는 기호 추론 계층, 이 둘을 연결하는 통합 계층의 세 가지 주요 부분으로 구성됩니다. 이제 각 계층에 대해 자세히 살펴보겠습니다.

신경 인식 계층

신경 인식 구성 요소는 이미지, 비디오, 텍스트 또는 오디오와 같은 비정형 데이터를 처리하여 시스템이 작업할 수 있는 내부 표현으로 변환합니다. 일반적으로 딥러닝 모델을 사용하여 패턴을 detect 입력된 개체나 특징을 식별합니다. 이 단계에서 시스템은 데이터에 존재하는 것을 인식하지만 아직 의미, 관계 또는 맥락을 추론하지는 못합니다.

다음은 이 계층에서 사용되는 몇 가지 일반적인 딥러닝 모델 유형입니다:

컨볼루션 신경망 (CNN): 이미지와 같은 격자형 데이터를 처리하도록 설계된 신경망의 일종입니다. CNN은 컨볼루션 필터를 사용하여 이미지를 스캔하고 가장자리, 질감, 모양과 같은 패턴을 detect . 이러한 패턴을 쌓아 자동차, 과일, 사람과 같은 물체를 인식하는 방법을 학습합니다.
‍
트랜스포머: 트랜스포머는 입력의 여러 부분이 서로 어떻게 연관되어 있는지 이해하도록 설계된 모델입니다. 정보를 순서대로 읽는 대신 데이터의 여러 부분을 동시에 보고 어떤 부분이 가장 중요한지 판단할 수 있습니다. 이를 통해 텍스트, 이미지 또는 두 가지 모두의 컨텍스트를 이해하는 데 도움이 됩니다. 이러한 유연성 때문에 트랜스포머는 대부분의 최신 언어 모델과 많은 시각 언어 시스템의 핵심 아키텍처입니다.
‍
순환 신경망 (RNN): 이 유형의 모델은 음성 또는 시계열 신호와 같은 순차적 데이터를 분석하도록 설계되었습니다. 이전 입력에 대한 메모리를 유지하므로 시간 경과에 따른 컨텍스트를 고려하여 예측할 수 있습니다.

궁극적으로 이러한 신경 모델은 원시 데이터에서 의미 있는 특징을 추출하고 표현합니다. 이 출력은 시스템이 감지한 내용을 해석하고 추론하는 기호 추론 계층의 입력이 됩니다.

상징적 추론 계층

상징적 추론 계층은 신경 인식 계층에서 생성된 정보를 논리를 사용해 이해합니다. 단순한 패턴 대신 규칙, 지식 그래프, 지식 기반, 온톨로지(개념과 개념이 서로 어떻게 연관되어 있는지에 대한 체계적인 설명) 등을 활용합니다. 이러한 요소들은 시스템이 서로 다른 요소들이 어떻게 서로 맞물려 있는지, 주어진 상황에서 어떤 행동이 합당한지 이해하는 데 도움이 됩니다.

예를 들어, 자율 주행 차량에서 신경 인식 계층은 카메라 피드에서 빨간 신호등을 인식할 수 있습니다. 그러면 기호 추론 레이어는 다음과 같은 규칙을 적용할 수 있습니다: "신호등이 빨간색이면 차량은 반드시 정지해야 한다."와 같은 규칙을 적용할 수 있습니다. 추론은 명확한 규칙에 기반하기 때문에 시스템의 결정을 설명하고 검증하기가 더 쉬우며, 이는 안전과 책임이 중요한 상황에서 특히 중요합니다.

통합 계층

통합 계층은 신경 지각 계층과 기호 추론 계층을 연결하여 학습과 추론이 함께 작동하도록 합니다. 한 방향으로는 신경 모델(예: 보행자 감지)의 출력을 물체와 그 속성을 설명하는 기호 표현으로 변환합니다.

다른 방향에서는 상징적인 규칙(예: "보행자가 횡단보도에 있으면 차량은 반드시 멈춰야 한다")을 취하여 신경 모델을 안내하는 신호로 변환합니다. 여기에는 이미지의 관련 영역을 강조 표시하거나, 주의에 영향을 주거나, 모델의 의사 결정 경로를 형성하는 것이 포함될 수 있습니다.

이러한 양방향 교환은 피드백 루프를 형성합니다. 신경 쪽은 기호적 규칙을 통해 구조와 해석 가능성을 얻고, 기호 쪽은 실제 데이터를 기반으로 보다 효과적으로 적응할 수 있습니다. 논리 신경망(LNN)과 같은 기술은 논리적 제약 조건을 신경 아키텍처에 직접 내장함으로써 이러한 상호 작용을 가능하게 합니다.

이러한 방식으로 지각과 추론을 연결함으로써 신경 기호 AI는 정확하고 해석하기 쉬운 의사 결정을 내릴 수 있습니다. 많은 연구자들은 이러한 접근 방식을 보다 신뢰할 수 있고 인간과 유사한 AI를 향한 유망한 단계로 보고 있으며, 향후 인공 일반 지능(AGI)으로의 발전을 위한 토대가 될 수 있을 것으로 기대하고 있습니다.

신경 기호 AI의 응용

이제 뉴로 심볼 AI가 무엇이며 어떻게 작동하는지 더 잘 이해했으니 실제 사용 사례를 살펴보겠습니다.

더 안전한 운전: 보행자를 보는 것부터 보행자를 이해하는 것까지

자율주행차가 안전하게 운행하려면 주변 환경을 이해해야 합니다. 자율주행차는 컴퓨터 비전과 같은 기술을 사용하여 보행자, 차량, 차선 표시, 교통 표지판 등을 detect .

딥러닝 모델은 이러한 객체를 정확하게 식별할 수 있지만, 이러한 객체가 문맥에서 무엇을 의미하는지 또는 실제 상황에서 서로 어떻게 연관되어 있는지 항상 이해하지는 못합니다. 예를 들어, 신경망 모델은 횡단보도에 있는 보행자를 인식할 수 있지만 횡단하려는 사람인지 아니면 그냥 서서 기다리는 사람인지 구분할 수 없습니다.

신경 기호 AI는 자율 주행 차량이 시각적 인식과 논리적 추론을 결합하여 사물을 식별하는 데 그치지 않고 상황을 해석할 수 있도록 함으로써 이러한 간극을 메우려고 시도합니다. 최근의 AI 연구에 따르면 신경 지각과 기호 규칙을 결합한 시스템이 보행자 행동 예측을 개선할 수 있는 것으로 나타났습니다.

이러한 시스템에서 신경 구성 요소는 보행자의 자세, 움직임, 위치와 같은 시각적 신호를 분석합니다. 그런 다음 기호 구성 요소는 그 사람이 횡단보도 근처에 있는지 또는 현재 교통 신호가 무엇을 나타내는지 등의 요소를 고려하여 논리적 규칙을 적용합니다.

이 두 가지 관점을 결합함으로써 신경 기호 시스템은 단순히 보행자를 detect 것 이상의 기능을 수행할 수 있습니다. 보행자가 횡단할 가능성이 있는지에 대한 합리적인 예측을 내릴 수 있고, 왜 그런 결정을 내렸는지 설명할 수 있습니다. 이는 자율 주행 차량의 더 안전하고 투명한 행동으로 이어집니다.

그림 3. 신경 기호 AI를 사용하여 관찰된 보행자 행동을 기반으로 예측하기.(출처)

‍

시각적 질문 답변의 논리적 해석

신경 기호 AI의 또 다른 중요한 응용 분야는 시각적 질문 답변(VQA)입니다. VQA 시스템은 이미지에 대한 질문에 답하도록 설계되었습니다.

대규모 언어 모델(LLM)과 시각 모델을 결합하여 시스템이 보는 것과 이해하는 것을 결합하여 다중 모드 추론을 수행합니다. 예를 들어, VQA 시스템에 이미지를 보여주고 "컵이 테이블 위에 있나요?"라고 묻는 경우, 시스템은 사물을 인식하는 동시에 사물 간의 관계도 이해해야 합니다. 컵이 실제로 장면에서 테이블 위에 있는지 여부를 판단해야 합니다.

최근 연구에서는 신경 기호 AI가 어떻게 신경 지각과 기호 추론을 통합하여 VQA를 향상시킬 수 있는지를 보여주었습니다. 제안된 시스템에서 신경망은 먼저 이미지를 분석하여 색상, 모양 또는 크기와 같은 물체와 그 속성을 인식합니다.

그런 다음 기호 추론 구성 요소는 논리적 규칙을 적용하여 이러한 객체들이 서로 어떻게 관련되어 있는지 해석하고 질문에 답합니다. "장면에 회색 실린더가 몇 개 있습니까?"라는 질문을 받으면 신경 부분이 모든 실린더와 그 색상을 식별하고 기호 부분이 기준에 따라 필터링하여 올바른 실린더를 세는 식입니다.

그림 4. 추상적인 지식과 논리가 필요한 VQA 시나리오의 예시.(출처)

‍

이러한 연구는 신경 기호적 VQA가 단순히 답을 제공하는 것 이상으로 어떻게 발전할 수 있는지를 보여줍니다. 이 모델은 결론에 도달하기까지의 단계를 보여줄 수 있기 때문에 시스템이 예측을 하고 사람들이 이해할 수 있는 방식으로 추론을 정당화할 수 있는 설명 가능한 AI를 지원합니다.

신경 기호 AI의 장단점

다음은 신경 기호 AI를 사용할 때 얻을 수 있는 몇 가지 주요 이점입니다:

더 강력한 추론 능력: 순수 딥러닝 모델과 달리 신경 기호 AI는 다단계 추론, 계획, 규칙 추종, 구조화된 지식 영역 처리가 필요한 작업을 수행할 수 있으며, 이는 전통적으로 기호 AI가 뛰어난 분야입니다.
↪f_200D↩
적응력: 이러한 시스템은 훈련받은 것 이상으로 논리적으로 추론할 수 있기 때문에 새롭거나 이전에 보지 못한 작업에서도 잘 수행합니다. 단순히 데이터를 암기하는 것이 아니라 관계와 패턴을 이해합니다.
‍
노이즈 및 모호성에 대한 견고성: 논리적 제약은 데이터가 노이즈가 많거나 불완전하거나 모호할 때 오류를 방지하는 데 도움이 될 수 있습니다. 추론 계층은 신경망 예측을 안내하거나 수정하는 규칙을 적용할 수 있습니다.

잠재력에도 불구하고 뉴로 심볼 AI는 여전히 진화 중이며 몇 가지 현실적인 과제를 안고 있습니다. 다음은 몇 가지 주요 한계입니다:

복잡한 통합: 이 하이브리드 프레임워크는 강력한 해석 가능성을 제공하지만, 지각과 추론을 통합하는 알고리즘을 설계하는 것은 여전히 어려운 과제입니다.
↪f_200D↩
확장성: 기호 추론은 대규모 지식 그래프나 복잡한 규칙 집합을 처리할 때 속도가 느려지거나 계산 비용이 많이 들 수 있습니다. 이로 인해 자율 주행, 비디오 처리 또는 대규모 지식 추론과 같은 실시간 애플리케이션을 효율적으로 배포하기가 더 어려워질 수 있습니다.
‍
추론의 견고성: 상징적 규칙이 너무 엄격하면 모호하거나 예측할 수 없는 실제 시나리오에서 시스템이 어려움을 겪을 수 있습니다. 유연한 학습과 신뢰할 수 있는 추론의 균형을 맞추는 것은 여전히 진행 중인 과제입니다.

주요 내용

신경 기호 AI는 세상을 인식할 뿐만 아니라 추론하고 결정을 설명할 수 있는 AI 시스템을 구축하는 데 있어 중요한 단계입니다. 데이터에서 학습한 패턴에 주로 의존하는 기존의 딥러닝 시스템과 달리 신경 기호 AI는 통계적 학습과 구조화된 논리 및 지식을 결합합니다. 딥러닝을 대체하는 것이 아니라 그 위에 구축되어 인간과 같은 방식으로 이해하고 추론할 수 있는 AI 개발에 조금 더 가까워집니다.

커뮤니티에 가입하고 깃허브 리포지토리를 살펴보세요. 솔루션 페이지에서 농업 분야 와 의료 분야의 컴퓨터 비전에서 AI의 다양한 적용 사례를 살펴보세요. 라이선스 옵션을 살펴보고 비전 AI 프로젝트 구축을 시작하세요!

새롭게 떠오르는 신경 기호 AI 분야에 대한 소개