용어집

자연어 처리(NLP)

챗봇, 감성 분석, 기계 번역과 같은 자연어 처리(NLP) 개념, 기술 및 애플리케이션에 대해 알아보세요.

자연어 처리(NLP)는 컴퓨터가 인간의 언어를 가치 있는 방식으로 이해하고, 해석하고, 생성하고, 상호 작용할 수 있도록 지원하는 인공지능(AI)머신러닝(ML) 의 역동적인 분야입니다. NLP의 궁극적인 목표는 인간과 기계 간의 커뮤니케이션 격차를 해소하여 소프트웨어가 인간의 능력을 뛰어넘는 규모와 속도로 텍스트 및 음성 데이터를 처리하고 분석할 수 있도록 하는 것입니다. 여기에는 자연어에 내재된 복잡성, 뉘앙스, 맥락을 처리할 수 있는 알고리즘과 모델을 개발하는 것이 포함됩니다.

NLP는 어떻게 작동하나요?

NLP 시스템은 통계 및 딥러닝 모델과 함께 컴퓨터 언어학(인간 언어의 규칙 기반 모델링)을 사용해 언어 데이터를 처리합니다. 이 프로세스는 일반적으로 토큰화라는 프로세스를 통해 원시 텍스트를 관리하기 쉬운 작은 단위로 분해하는 데이터 전처리로 시작됩니다.

토큰화된 최신 NLP 파이프라인은 순환 신경망(RNN) 과 같은 고급 신경망 아키텍처와 최근에는 영향력이 큰 트랜스포머 아키텍처를 활용합니다. 오늘날의 대규모 언어 모델(LLM)의 기반이 되는 이러한 모델은 단어 간의 문맥 관계를 분석합니다. 이를 통해 의도 인식, 언어 번역, 원본 콘텐츠 제작과 같은 복잡한 작업을 수행할 수 있습니다. 스탠포드 NLP 그룹과 같은 선도적인 기관과 컴퓨터 언어학 협회(ACL)와 같은 단체가 이 연구의 선두에 서 있습니다.

실제 애플리케이션

NLP는 많은 사람들이 매일 사용하는 다양한 애플리케이션을 지원합니다. 대표적인 두 가지 예가 있습니다:

  1. 기계 번역: Google 번역과 같은 도구는 정교한 자연어 처리 모델을 사용하여 텍스트와 음성을 한 언어에서 다른 언어로 자동으로 번역합니다. 이러한 시스템은 소스 언어의 문장 구조와 의미를 분석한 다음 대상 언어로 문법적으로 정확하고 문맥에 적합한 번역을 생성합니다. 이러한 모델은 유엔 회의록과 같은 출처의 방대한 평행 텍스트 데이터 세트를 학습합니다.

  2. 감정 분석: 기업들은 소셜 미디어, 제품 리뷰, 설문조사에서 얻은 고객 피드백을 분석하기 위해 NLP를 사용합니다. 텍스트의 감정 어조를 긍정, 부정, 중립으로 분류함으로써 기업은 여론, 고객 만족도, 브랜드 인식에 대한 인사이트를 얻고 데이터에 기반한 의사 결정을 내릴 수 있습니다.

기타 일반적인 애플리케이션으로는 Siri 및 Alexa와 같은 지능형 가상 비서, 스팸 이메일 필터, 텍스트 요약 도구, 고객 서비스용 챗봇 등이 있습니다.

NLP와 관련 개념

관련성이 있지만 NLP는 일부 유사한 용어와 다릅니다:

  • 자연어 이해(NLU): NLU는 언어에서 의미, 의도, 문맥을 추출하는 이해 측면에 특별히 초점을 맞춘 NLP의 하위 집합입니다. NLP는 더 광범위하며 텍스트 생성 및 음성 합성과 같은 작업도 포함합니다.
  • 텍스트 생성: 이는 인간과 유사한 텍스트를 생성하는 데 중점을 둔 NLP 내의 특정 기능 또는 작업입니다. 챗봇이나 번역과 같은 많은 NLP 애플리케이션의 핵심 부분이지만, NLP의 이해나 분석 측면은 다루지 않습니다.
  • 컴퓨터 비전(CV): CV는 이미지 및 비디오와 같은 시각적 입력에서 정보를 해석하고 이해하는 작업을 처리하며, 물체 감지 또는 이미지 분할과 같은 작업에 중점을 둡니다. 반대로 NLP는 언어 데이터에 중점을 둡니다. 그러나 텍스트와 이미지를 모두 처리하는 멀티모달 모델에서 이 두 분야가 점점 더 교차하고 있으며, 자동 이미지 캡션과 같은 애플리케이션을 가능하게 합니다. NLP와 CV의 연결에 대해 자세히 알아보세요. Ultralytics는 높은 정확도와 속도가 요구되는 작업을 위한 Ultralytics YOLO11과 같은 모델을 제공하는 CV 전문 기업입니다.

도구 및 플랫폼

NLP 애플리케이션을 개발 및 배포하려면 종종 전문 라이브러리와 플랫폼을 활용해야 합니다:

  • 라이브러리: spaCyNLTK와 같은 오픈 소스 라이브러리는 토큰화, 구문 분석 및 엔티티 인식과 같은 일반적인 NLP 작업을 위한 도구를 제공합니다.
  • 플랫폼: 허깅 페이스는 개발을 크게 가속화하는 사전 학습된 모델(특히 트랜스포머), 데이터 세트 및 도구의 방대한 리포지토리를 제공합니다. NLP 또는 결합된 CV-NLP 파이프라인에 사용되는 모델을 포함하여 ML 모델의 엔드투엔드 수명 주기를 관리하기 위해, Ultralytics HUB와 같은 플랫폼은 강력한 MLOps 기능을 제공하여 교육, 배포 및 모니터링을 간소화합니다. 모델 개발 및 배포에 대한 더 많은 리소스는 Ultralytics 설명서를 참조하세요.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨