Yolo 비전 선전
선전
지금 참여하기
용어집

자연어 처리(NLP)

챗봇, 감성 분석, 기계 번역과 같은 자연어 처리(NLP) 개념, 기술 및 애플리케이션을 알아보세요.

Natural Language Processing (NLP) is a dynamic branch of Artificial Intelligence (AI) that focuses on the interaction between computers and human language. Unlike traditional programming that relies on precise, structured inputs, NLP enables machines to understand, interpret, and generate human language in a way that is both valuable and meaningful. By combining computational linguistics with statistical, machine learning, and Deep Learning (DL) models, NLP allows systems to process text and voice data with an intent to extract meaning, sentiment, and context.

핵심 메커니즘

At its core, NLP involves transforming raw text into a numerical format that computers can process, a step often achieved through tokenization and the creation of embeddings. Modern systems utilize the Transformer architecture, which employs a self-attention mechanism to weigh the importance of different words in a sentence relative to one another. This allows models to handle long-range dependencies and nuances such as sarcasm or idioms, which were difficult for earlier Recurrent Neural Networks (RNN) to manage.

실제 애플리케이션

NLP technology is ubiquitous in modern software, powering tools that businesses and individuals use daily to streamline operations and enhance user experiences.

  • 고객 서비스 자동화: 많은 기업들이 고객 문의를 처리하기 위해 챗봇과 자동화 에이전트를 활용합니다. 이러한 시스템은 감정 분석을 통해 메시지 뒤에 숨겨진 감정적 어조를 파악하여 고객이 만족했는지, 좌절했는지, 아니면 질문을 하는지 식별함으로써 응답 우선순위를 정할 수 있게 합니다. Google Natural Language API와 같은 도구는 개발자에게 이러한 기능을 신속하게 구현할 수 있는 사전 훈련된 모델을 제공합니다.
  • 비전-언어 통합: 컴퓨터 비전(CV) 분야에서 NLP는 "열린 어휘" 검출을 가능하게 합니다. 고정된 클래스 목록(예: COCO 80개 클래스)으로 모델을 훈련하는 대신, YOLO 같은 모델은 텍스트 인코더를 활용해 자연어 설명을 기반으로 물체를 식별합니다. 이 연결 고리를 통해 사용자는 모델을 재훈련하지 않고도 "빨간 헬멧을 쓴 사람"과 같은 특정 항목을 찾을 수 있습니다.
  • Language Translation: Services like Google Translate leverage Machine Translation to convert text from one language to another instantly, breaking down global communication barriers.

관련 용어 구분하기

NLP의 범위를 이해하려면 데이터 과학 분야에서 밀접하게 관련된 개념들과 구분하는 것이 도움이 됩니다:

  • 자연어 이해(NLU): NLP가 포괄적인 분야인 반면, NLU는 독해에 초점을 맞춘 특정 하위 분야입니다. NLU는 텍스트의 의도와 의미를 파악하고, 모호성과 문맥을 처리하는 작업을 다룹니다.
  • 대규모 언어 모델(LLMs): GPT 시리즈나 Llama와 같은 대규모 언어 모델(LLMs)은 페타바이트 규모의 데이터로 훈련된 거대한 딥러닝 모델입니다. 이들은 고급 자연어 처리(NLP) 작업을 수행하는 도구로, 정교한 텍스트 생성 및 추론 능력을 갖추고 있습니다.
  • 광학 문자 인식(OCR): OCR은 엄밀히 말해 텍스트 이미지(스캔된 문서)를 기계가 인식 가능한 텍스트로 변환하는 과정입니다. NLP는 OCR이 내용을 디지털화한 작성된 내용을 이해하기 위해 이어서 수행됩니다.

코드 예시: 텍스트와 비전의 연결

다음 예시는 NLP 개념이 컴퓨터 비전과 어떻게 상호작용하는지 보여줍니다. 우리는 ultralytics 텍스트 프롬프트를 이해하는 모델을 로드하는 패키지입니다. 자연어로 정의된 사용자 정의 클래스를 통해, 모델의 내부 어휘(임베딩)를 활용하여 이미지 내의 detect .

from ultralytics import YOLOWorld

# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")

# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])

# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")

# Show the results
results[0].show()

도구 및 향후 방향

자연어 처리 애플리케이션 개발에는 종종 강력한 라이브러리가 필요합니다. 연구자들은 흔히 PyTorch 사용하며, Natural Language Toolkit (NLTK) 은 교육적 전처리 작업에 여전히 필수 도구로 자리 잡고 있습니다. 생산 등급 텍스트 처리를 위해 spaCy는 그 효율성으로 널리 채택되고 있습니다.

인공지능이 진화함에 따라 모달리티 융합은 핵심 트렌드입니다. 플랫폼들은 비전과 언어를 상호 연결된 데이터 스트림으로 처리하는 통합 워크플로로 진화하고 있습니다. Ultralytics 데이터셋 관리, 이미지 주석 부착, 최첨단 모델 훈련을 위한 도구를 제공함으로써 이 라이프사이클을 간소화합니다. NLP가 언어적 측면을 처리하는 동안, YOLO26과 같은 고성능 비전 모델은 시각적 데이터가 실시간 에지 애플리케이션에 필요한 속도와 정확도로 처리되도록 보장하여 다중 모달 AI 시스템에 원활한 경험을 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기