Yolo 비전 선전
선전
지금 참여하기
용어집

자연어 이해(NLU)

자연어 이해(NLU) – 기계가 인간의 언어를 이해하고 해석하고 응답할 수 있도록 하는 AI 혁신을 알아보세요.

자연어 이해(NLU)는 다음과 같은 전문 하위 분야입니다. 인공 지능(AI)의 전문 하위 분야로 기계 독해에 초점을 맞춘 인공지능의 전문 하위 분야입니다. 표준 텍스트 처리는 단어 수를 계산할 수 있지만, NLU는 인간 언어의 이면에 있는 의미, 의도, 정서를 해독하는 것을 목표로 합니다. 소프트웨어가 다음을 수행할 수 있게 해주는 '두뇌'입니다. 이메일, 채팅 로그, 음성 명령과 같은 구조화되지 않은 텍스트를 해석하고 이를 실행 가능한 구조화된 데이터로 변환합니다. 이 기능은 다음과 같은 직관적인 시스템을 구축하는 데 있어 기본이 됩니다. 챗봇 및 사용자와 자연스럽게 상호작용할 수 있는 가상 비서 직관적인 시스템을 구축하는 데 기본이 됩니다.

NLU의 핵심 구성 요소

언어를 효과적으로 '이해'하기 위해 NLU 시스템은 입력을 여러 의미 있는 계층으로 세분화합니다. 이 프로세스는 원시 텍스트를 알고리즘이 작동할 수 있는 구조화된 형식으로 변환합니다.

  • 의도 인식: 이는 사용자의 목표를 식별합니다. 예를 들어 사용자가 "도쿄행 항공편이 필요해요. 비행기가 필요해요"라고 입력하면 그 의도는 BookFlight. 이는 목표 지향적인 AI 에이전트에게 매우 중요합니다.
  • 네임드 엔티티 인식(NER): 이름, 날짜, 위치 또는 제품 코드와 같은 특정 정보를 추출합니다. 다음과 같은 문구에서 "금요일에 글렌과 미팅"이라는 문구에서 NER은 '글렌'을 PERSON 및 "금요일"로 DATE.
  • 감정 분석: 이 는 텍스트의 감정 어조(긍정, 부정 또는 중립)를 평가합니다. 고객 지원에서 다음과 같은 용도로 널리 사용됩니다. 사용자 만족도를 자동으로 측정하는 데 널리 사용됩니다.
  • 문맥 추론: 고급 NLU, 주로 다음을 통해 구동 대규모 언어 모델(LLM)트랜스포머는 개별 문장을 넘어 다음과 같은 작업을 수행합니다. 참조와 모호성을 이해합니다(예: 대화에서 '그것'이 무엇을 가리키는지 이해).

실제 애플리케이션

NLU는 우리가 매일 사용하는 많은 기술의 기반이 되는 엔진으로, 인간과 기계의 커뮤니케이션과 로직을 연결합니다.

  1. 고객 서비스 자동화: 기업들은 NLU를 사용하여 지능형 지원 에이전트를 강화합니다. 다음과 같은 플랫폼 IBM 왓슨 자연어 이해 와 같은 플랫폼은 수신되는 지원 티켓을 분석하여 의도에 따라 올바른 부서로 라우팅하고 문제 설명을 기반으로 응답을 제안할 수도 있습니다.
  2. 시맨틱 검색: 정확한 단어를 일치시키는 키워드 검색과 달리 NLU 기반 검색 엔진은 은 쿼리의 의미를 이해합니다. 따라서 사용자는 " Ultralytics CEO는 누구인가요?"와 같은 질문을 할 수 있습니다. 와 같은 질문을 하면 "CEO"라는 단어가 포함된 링크 목록이 아닌 직접적인 답변을 받을 수 있습니다.
  3. 음성 인식 제어: 디바이스는 NLU를 사용하여 음성 명령을 구문 분석합니다. 사용자가 "거실 조명 거실 조명 꺼"라고 말하면 시스템은 NLU를 사용하여 동작("끄기")과 대상("거실 조명")을 식별합니다. 엔티티("거실 조명")를 식별합니다.

NLU 대 NLP 대 컴퓨터 비전

NLU를 관련 AI 분야와 구분하는 것이 도움이 됩니다:

  • 자연어 처리(NLP): NLP는 모든 언어 작업을 포괄하는 가장 중요한 분야입니다. NLU는 구체적으로 이해 하위 집합(입력 $\-to$ 의미)입니다. 또 다른 하위 집합인 자연어 생성(NLG)은 다음을 처리합니다. 텍스트 생성(의미 $\to$ 출력)을 처리합니다.
  • 컴퓨터 비전(CV): 반면 NLU는 텍스트를 처리하는 반면, CV는 시각적 데이터를 해석합니다. 그러나 현대의 멀티 모달 모델 결합 결합합니다. 예를 들어, YOLO 같은 모델은 NLU를 사용하여 다음을 수행합니다. 텍스트 프롬프트(예: "파란색 배낭")를 해석한 다음 CV를 사용하여 이미지에서 해당 개체를 찾습니다.

비전 AI의 NLU: 개방형 어휘 감지

NLU를 컴퓨터 비전과 통합하면 "개방형 어휘 개체 감지"가 가능합니다. COCO의 80개 클래스처럼 COCO 80개 클래스처럼 고정된 클래스 목록에 국한되지 않고, 모델은 설명 텍스트를 기반으로 객체를 detect 수 있습니다. 그리고 Ultralytics YOLOWorld 모델은 온보드 텍스트 인코더를 사용하여 "이해"함으로써 이를 예시합니다. 이해합니다.

다음 예는 NLU를 통해 비전 모델이 순수하게 텍스트로만 정의된 사용자 지정 객체를 detect 방법을 보여줍니다:

from ultralytics import YOLOWorld

# Load a YOLO-World model (incorporates NLU for text-based class definition)
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language
# The model's NLU component understands these terms without retraining
model.set_classes(["person reading a book", "red coffee mug"])

# Run inference on an image
results = model.predict("library.jpg")

# Display results
results[0].show()

도구 및 향후 트렌드

NLU 분야는 다음과 같은 그룹의 연구에 힘입어 빠르게 발전하고 있습니다. 스탠포드 NLP 그룹과 컴퓨터 언어학 협회(ACL) 등의 연구에 힘입어 빠르게 발전하고 있습니다. 기술이 발전하고 있습니다. 단순한 키워드 매칭에서 심층적인 문맥 이해로 나아가고 있습니다.

개발자를 위해 곧 출시될 Ultralytics 플랫폼 (2026년 출시)은 다음과 같은 수명 주기를 간소화합니다. AI 모델을 통해 데이터 세트를 더 쉽게 관리하고 비전과 언어 이해를 모두 활용하는 복잡한 멀티모달 시스템을 언어 이해. 현재 최첨단 비전 작업은 다음을 통해 처리할 수 있습니다. YOLO11로 처리할 수 있으며, 차세대 속도와 정확성의 더욱 긴밀한 통합을 목표로 하는 YOLO26에 대한 연구개발이 계속되고 있습니다. 다음과 같은 클라우드 서비스 Google 클라우드 자연어와 같은 클라우드 서비스는 애플리케이션에 순수한 자연어 처리 기능을 추가하기 위한 애플리케이션에 순수 NLU 기능을 추가할 수 있는 강력한 API도 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기