자연어 이해(NLU)를 탐구하고, 이를 통해 기계가 의도와 감정을 해석하는 방식을 알아보세요. 인간 언어와 비전 AI를 연결하는 방법을 배워보세요.
자연어 이해(NLU)는 인공 지능(AI) 의 특수한 하위 분야로, 기계가 인간의 언어를 읽고 이해하며 해석하는 데 중점을 둡니다. 보다 광범위한 기술이 컴퓨터로 하여금 텍스트 데이터를 처리하게 하는 반면, NLU는 특히 시스템이 단어 뒤에 숨겨진 의미, 의도, 감정을 파악하고 문법, 속어, 맥락의 복잡성을 헤쳐나가도록 합니다. 심층 학습(DL) 아키텍처와 자연어 이해(NLU) 변환을 활용함으로써, 딥 러닝(DL) 아키텍처를 활용하여 NLU는 구조화되지 않은 텍스트를 구조화된 기계가 읽을 수 있는 논리로 변환하며, 인간 커뮤니케이션과 계산적 행동 사이의 가교 역할을 수행합니다.
언어를 이해하기 위해 NLU 알고리즘은 텍스트를 구성 요소로 분해하고 그 관계들을 분석합니다. 이 과정에는 다음과 같은 핵심 언어학 개념들이 포함됩니다:
컴퓨터 과학 분야에서 NLU를 밀접하게 관련된 분야들과 구분하는 것은 필수적이다:
NLU는 기업과 소비자가 매일 의존하는 수많은 지능형 시스템의 핵심 기술입니다.
다음 예시는 NLU 개념이 컴퓨터 비전 워크플로에 어떻게 통합되는지 보여줍니다.
ultralytics 패키지. 여기서는 텍스트 인코더(NLU)와 비전 백본을 결합한 모델을 사용하여
순수하게 자연어 설명으로 정의된 detect .
from ultralytics import YOLOWorld
# Load a model capable of vision-language understanding
# This model uses NLU to interpret text prompts
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes using natural language descriptions
# The NLU component parses "person in red shirt" to guide detection
model.set_classes(["person in red shirt", "blue bus"])
# Run inference on an image
results = model.predict("city_street.jpg")
# Display the results
results[0].show()
NLU의 발전은 견고한 프레임워크에 의존합니다. PyTorch 는 딥러닝 모델 구축에 필요한 tensor 제공하는 반면, spaCy는 언어 처리를 위한 산업용 수준의 도구를 제공합니다.
앞으로 산업계는 통합된 다중 모달 시스템으로 나아가고 있습니다. Ultralytics 이러한 진화를 단순화하여 데이터셋 관리, 이미지 주석 작업, 에지 배포 가능한 모델 훈련을 위한 포괄적인 환경을 제공합니다. 대규모 언어 모델(LLM) 이 복잡한 추론을 처리하는 동안, YOLO26과 같은 고속 비전 모델과 통합하면 실시간으로 세상을 보고, 이해하고, 상호작용할 수 있는 강력한 에이전트를 창출합니다. 이러한 시너지는 머신 러닝(ML) 애플리케이션의 차세대 영역을 대표합니다.