Yolo 비전 선전
선전
지금 참여하기
용어집

자연어 이해(NLU)

자연어 이해(NLU)를 탐구하고, 이를 통해 기계가 의도와 감정을 해석하는 방식을 알아보세요. 인간 언어와 비전 AI를 연결하는 방법을 배워보세요.

자연어 이해(NLU)는 인공 지능(AI) 의 특수한 하위 분야로, 기계가 인간의 언어를 읽고 이해하며 해석하는 데 중점을 둡니다. 보다 광범위한 기술이 컴퓨터로 하여금 텍스트 데이터를 처리하게 하는 반면, NLU는 특히 시스템이 단어 뒤에 숨겨진 의미, 의도, 감정을 파악하고 문법, 속어, 맥락의 복잡성을 헤쳐나가도록 합니다. 심층 학습(DL) 아키텍처와 자연어 이해(NLU) 변환을 활용함으로써, 딥 러닝(DL) 아키텍처를 활용하여 NLU는 구조화되지 않은 텍스트를 구조화된 기계가 읽을 수 있는 논리로 변환하며, 인간 커뮤니케이션과 계산적 행동 사이의 가교 역할을 수행합니다.

NLU의 핵심 메커니즘

언어를 이해하기 위해 NLU 알고리즘은 텍스트를 구성 요소로 분해하고 그 관계들을 분석합니다. 이 과정에는 다음과 같은 핵심 언어학 개념들이 포함됩니다:

  • 토큰화: 기초 단계 원본 텍스트를 단어 또는 하위 단어로 세분화하는 과정입니다. 이는 신경망 내에서 데이터를 수치적으로 표현할 수 있도록 준비합니다.
  • 명명된 엔티티 인식(NER): NLU 모델은 문장 내 특정 엔티티(예: 인물, 장소, 날짜, 조직)를 식별합니다. 예를 들어, "런던행 항공편 예약"이라는 문장에서 "런던"은 장소 엔티티로 추출됩니다.
  • 의도 분류: 대화형 시스템의 핵심 기능으로, 사용자의 목표를 판단합니다. 예를 들어 "내 인터넷이 안 돼"라는 문구를 분석하여 사용자가 일반적인 질문이 아닌 기술적 문제를 보고하고 있음을 파악합니다.
  • 의미 분석: 단순한 키워드를 넘어, 이 과정은 문장 구조의 의미를 평가합니다. 스탠퍼드 NLP 그룹의 연구진은 오랫동안 문맥에 기반해 단어의 의미를 명확히 구분하는 방법을 선도해 왔습니다. 이를 통해 "은행"이 주변 텍스트에 따라 금융 기관으로 해석되거나 강변으로 해석되는지 정확히 파악할 수 있습니다.

NLU 대 관련 학문 분야

컴퓨터 과학 분야에서 NLU를 밀접하게 관련된 분야들과 구분하는 것은 필수적이다:

  • 자연어 처리(NLP): NLP는 NLU를 포함하는 포괄적인 상위 개념입니다. NLP는 번역 및 단순 구문 분석을 포함한 언어 데이터 처리의 전체 파이프라인을 다루는 반면, NLU는 엄밀히 말해 이해 측면만을 다룹니다. 또 다른 하위 분야인 자연어 생성(NLG)은 새로운 텍스트 응답을 생성하는 작업을 담당합니다.
  • 컴퓨터 비전(CV): 전통적으로 CV는 시각 데이터를 처리하는 반면 NLU는 텍스트를 처리합니다. 그러나 현대적인 다중 모달 모델은 이러한 분야를 융합합니다. NLU는 텍스트 프롬프트(예: "빨간 차를 찾아라")를 분석하고, CV는 그 이해를 바탕으로 시각적 검색을 실행합니다.
  • 음성 인식: 음성-텍스트 변환으로도 알려진 이 기술은 오디오 신호를 문자로 변환합니다. NLU는 음성이 텍스트로 변환된 후에만 개입하여 말한 내용을 해석합니다.

실제 애플리케이션

NLU는 기업과 소비자가 매일 의존하는 수많은 지능형 시스템의 핵심 기술입니다.

  1. 지능형 고객 지원: 현대적인 챗봇은 NLU(자연어 이해)를 활용하여 인간의 개입 없이 지원 티켓을 해결합니다. 감정 분석을 적용함으로써, 이러한 에이전트는 고객 메시지 내 좌절감을 detect 문제를 자동으로 인간 관리자에게 에스컬레이션할 수 detect .
  2. 의미 기반 검색 엔진: 기존 키워드 검색과 달리 NLU 기반 엔진은 쿼리의 맥락을 이해합니다. 기업들은 의미 기반 검색을 활용하여 직원들이 "지난 4분기 판매 보고서 보여줘"와 같은 자연스러운 질문으로 내부 데이터베이스를 검색할 수 있게 함으로써, 관련성이 낮은 파일 목록이 아닌 정확한 문서를 제공합니다.
  3. 비전-언어 통합: 비전 AI 분야에서 NLU는 "개방형 어휘 객체 탐지"를 가능케 합니다. 표준 데이터셋의 80개 클래스와 같은 고정 범주에 국한되지 않고, YOLO 같은 모델은 NLU를 활용해 사용자 정의 텍스트 프롬프트를 이해하고 이미지 내에서 해당 객체를 찾아냅니다.

코드 예시: 자연어 이해 기반 객체 탐지

다음 예시는 NLU 개념이 컴퓨터 비전 워크플로에 어떻게 통합되는지 보여줍니다. ultralytics 패키지. 여기서는 텍스트 인코더(NLU)와 비전 백본을 결합한 모델을 사용하여 순수하게 자연어 설명으로 정의된 detect .

from ultralytics import YOLOWorld

# Load a model capable of vision-language understanding
# This model uses NLU to interpret text prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language descriptions
# The NLU component parses "person in red shirt" to guide detection
model.set_classes(["person in red shirt", "blue bus"])

# Run inference on an image
results = model.predict("city_street.jpg")

# Display the results
results[0].show()

도구 및 향후 트렌드

NLU의 발전은 견고한 프레임워크에 의존합니다. PyTorch 는 딥러닝 모델 구축에 필요한 tensor 제공하는 반면, spaCy는 언어 처리를 위한 산업용 수준의 도구를 제공합니다.

앞으로 산업계는 통합된 다중 모달 시스템으로 나아가고 있습니다. Ultralytics 이러한 진화를 단순화하여 데이터셋 관리, 이미지 주석 작업, 에지 배포 가능한 모델 훈련을 위한 포괄적인 환경을 제공합니다. 대규모 언어 모델(LLM) 이 복잡한 추론을 처리하는 동안, YOLO26과 같은 고속 비전 모델과 통합하면 실시간으로 세상을 보고, 이해하고, 상호작용할 수 있는 강력한 에이전트를 창출합니다. 이러한 시너지는 머신 러닝(ML) 애플리케이션의 차세대 영역을 대표합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기