용어집

자연어 처리(NLP)

Ultralytics 자연어 처리(NLP)를 탐구하세요. Ultralytics 통해 NLP가 챗봇, 감정 분석, 개방형 어휘 감지를 어떻게 구현하는지 알아보세요.

자연어 처리(NLP)는 인공지능(AI)의 역동적인 한 분야로, 컴퓨터와 인간 언어 간의 상호작용에 중점을 둡니다. 정확하고 구조화된 입력에 의존하는 전통적인 프로그래밍과 달리, NLP는 기계가 인간 언어를 가치 있고 의미 있는 방식으로 이해하고 해석하며 생성할 수 있게 합니다. 계산 언어학을 통계적 모델, 기계 학습 및 딥 러닝(DL) 모델과 결합함으로써, NLP는 시스템이 의미, 감정 및 맥락을 추출하기 위한 목적으로 텍스트 및 음성 데이터를 처리할 수 있게 합니다.

핵심 메커니즘

핵심적으로 NLP는 원시 텍스트를 컴퓨터가 처리할 수 있는 수치 형식으로 변환하는 과정을 포함하며, 이 단계는 흔히 토큰화와 임베딩 생성을 통해 달성됩니다. 현대 시스템은 트랜스포머 아키텍처를 활용하는데, 이는 자기 주의 메커니즘을 사용하여 문장 내 서로 다른 단어들의 상대적 중요도를 가중치로 부여합니다. 이를 통해 모델은 이전의 재귀 신경망(RNN) 이 처리하기 어려웠던 비아냥이나 관용구 같은 미묘한 표현과 장거리 의존성을 처리할 수 있게 되었습니다.

실제 애플리케이션

NLP 기술은 현대 소프트웨어에 널리 퍼져 있으며, 기업과 개인이 매일 사용하는 도구를 구동하여 업무를 효율화하고 사용자 경험을 향상시킵니다.

고객 서비스 자동화: 많은 기업들이 고객 문의를 처리하기 위해 챗봇과 자동화 에이전트를 활용합니다. 이러한 시스템은 감정 분석을 통해 메시지 뒤에 숨겨진 감정적 어조를 파악하여 고객이 만족했는지, 좌절했는지, 아니면 질문을 하는지 식별함으로써 응답 우선순위를 정할 수 있게 합니다. Google Natural Language API와 같은 도구는 개발자에게 이러한 기능을 신속하게 구현할 수 있는 사전 훈련된 모델을 제공합니다.
비전-언어 통합: 컴퓨터 비전(CV) 분야에서 NLP는 "열린 어휘" 검출을 가능하게 합니다. 고정된 클래스 목록(예: COCO 80개 클래스)으로 모델을 훈련하는 대신, YOLO 같은 모델은 텍스트 인코더를 활용해 자연어 설명을 기반으로 물체를 식별합니다. 이 연결 고리를 통해 사용자는 모델을 재훈련하지 않고도 "빨간 헬멧을 쓴 사람"과 같은 특정 항목을 찾을 수 있습니다.
언어 번역: Google 같은 서비스는 기계 번역 기술을 활용하여 텍스트를 한 언어에서 다른 언어로 즉시 변환함으로써 글로벌 커뮤니케이션 장벽을 허물고 있습니다.

코드 예시: 텍스트와 비전의 연결

다음 예시는 NLP 개념이 컴퓨터 비전과 어떻게 상호작용하는지 보여줍니다. 우리는 ultralytics 텍스트 프롬프트를 이해하는 모델을 로드하는 패키지입니다. 자연어로 정의된 사용자 정의 클래스를 통해, 모델의 내부 어휘(임베딩)를 활용하여 이미지 내의 detect .

from ultralytics import YOLOWorld

# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")

# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])

# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")

# Show the results
results[0].show()

도구 및 향후 방향

자연어 처리 애플리케이션 개발에는 종종 강력한 라이브러리가 필요합니다. 연구자들은 흔히 PyTorch 사용하며, Natural Language Toolkit (NLTK) 은 교육적 전처리 작업에 여전히 필수 도구로 자리 잡고 있습니다. 생산 등급 텍스트 처리를 위해 spaCy는 그 효율성으로 널리 채택되고 있습니다.

인공지능이 진화함에 따라 모달리티 융합은 핵심 트렌드입니다. 플랫폼들은 비전과 언어를 상호 연결된 데이터 스트림으로 처리하는 통합 워크플로로 진화하고 있습니다. Ultralytics 데이터셋 관리, 이미지 주석 부착, 최첨단 모델 훈련을 위한 도구를 제공함으로써 이 라이프사이클을 간소화합니다. NLP가 언어적 측면을 처리하는 동안, YOLO26과 같은 고성능 비전 모델은 시각적 데이터가 실시간 에지 애플리케이션에 필요한 속도와 정확도로 처리되도록 보장하여 다중 모달 AI 시스템에 원활한 경험을 제공합니다.

자연어 처리(NLP)

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

핵심 메커니즘

실제 애플리케이션

관련 용어 구분하기

코드 예시: 텍스트와 비전의 연결

도구 및 향후 방향

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입