욜로 비전 선전
선전
지금 참여하기
용어집

자연어 처리(NLP)

챗봇, 감성 분석, 기계 번역과 같은 자연어 처리(NLP) 개념, 기술 및 애플리케이션을 알아보세요.

자연어 처리(NLP)는 컴퓨터가 인간의 언어를 이해, 해석, 생성하고 상호 작용할 수 있도록 하는 데 전념하는 인공 지능(AI)머신 러닝(ML)의 역동적인 분야입니다. NLP의 궁극적인 목표는 인간과 기계 간의 통신 격차를 해소하여 소프트웨어가 인간의 능력 이상의 규모와 속도로 텍스트 및 음성 데이터를 처리하고 분석할 수 있도록 하는 것입니다. 여기에는 자연어에 내재된 복잡성, 뉘앙스 및 컨텍스트를 처리할 수 있는 알고리즘 및 모델 개발이 포함됩니다.

NLP는 어떻게 작동하나요?

NLP 시스템은 전산 언어학(인간 언어의 규칙 기반 모델링)과 통계 및 딥 러닝 모델을 사용하여 언어 데이터를 처리합니다. 이 프로세스는 일반적으로 데이터 전처리로 시작되며, 여기서 원시 텍스트는 토큰화라는 프로세스를 통해 더 작고 관리하기 쉬운 단위로 나뉩니다.

토큰화되면 최신 NLP 파이프라인은 RNN(순환 신경망)과 같은 고급 신경망 아키텍처와 최근에는 매우 영향력 있는 Transformer 아키텍처를 활용합니다. 오늘날의 LLM(대규모 언어 모델)의 기반을 형성하는 이러한 모델은 단어 간의 문맥적 관계를 분석합니다. 이를 통해 의도 인식, 언어 번역, 심지어 독창적인 콘텐츠 생성과 같은 복잡한 작업을 수행할 수 있습니다. Stanford NLP Group과 같은 주요 기관과 Association for Computational Linguistics (ACL)과 같은 조직이 이 연구의 최전선에 있습니다.

실제 애플리케이션

NLP는 우리 중 많은 사람들이 매일 사용하는 광범위한 애플리케이션을 지원합니다. 두 가지 주요 예는 다음과 같습니다.

  1. 기계 번역: Google 번역과 같은 도구는 정교한 NLP 모델을 사용하여 텍스트와 음성을 한 언어에서 다른 언어로 자동 번역합니다. 이러한 시스템은 원본 언어의 문장 구조와 의미를 분석한 다음, 문법적으로 정확하고 문맥에 적합한 번역문을 대상 언어로 생성합니다. 이러한 모델은 국제 연합 회의록과 같은 소스의 병렬 텍스트로 구성된 대규모 데이터 세트에서 학습됩니다.

  2. 감성 분석: 기업은 NLP를 사용하여 소셜 미디어, 제품 리뷰 및 설문 조사에서 고객 피드백을 분석합니다. 텍스트의 감정적 톤을 긍정적, 부정적 또는 중립으로 분류함으로써 기업은 여론, 고객 만족도 및 브랜드 인식에 대한 통찰력을 얻어 데이터 기반 의사 결정을 내릴 수 있습니다.

다른 일반적인 응용 분야로는 Siri 및 Alexa와 같은 지능형 가상 비서, 스팸 메일 필터, 텍스트 요약 도구, 고객 서비스를 위한 챗봇 등이 있습니다.

NLP vs. 관련 개념

NLP는 관련이 있지만, 다음과 같은 유사한 용어와는 다릅니다.

  • 자연어 이해(NLU): NLU는 특히 언어에서 의미, 의도 및 맥락을 추출하는 데 초점을 맞춘 NLP의 하위 집합입니다. NLP는 더 광범위하며 텍스트 생성 및 음성 합성 같은 작업도 포함합니다.
  • 텍스트 생성: 이는 인간과 유사한 텍스트를 생성하는 데 중점을 둔 NLP 내의 특정 기능 또는 작업입니다. 챗봇이나 번역과 같은 많은 NLP 애플리케이션의 핵심 부분이지만 NLP의 이해 또는 분석 측면을 다루지는 않습니다.
  • 컴퓨터 비전(CV): CV는 이미지 및 비디오와 같은 시각적 입력으로부터 정보를 해석하고 이해하는 것을 다루며, 객체 감지 또는 이미지 분할과 같은 작업에 중점을 둡니다. 반대로 NLP는 언어 데이터에 중점을 둡니다. 그러나 이 분야는 텍스트와 이미지를 모두 처리하여 자동 이미지 캡션 달기와 같은 애플리케이션을 가능하게 하는 다중 모드 모델에서 점점 더 교차하고 있습니다. NLP와 CV 연결에 대해 자세히 알아볼 수 있습니다. Ultralytics는 높은 정확도와 속도를 요구하는 작업에 Ultralytics YOLO11과 같은 모델을 제공하여 CV를 전문으로 합니다.

도구 및 플랫폼

NLP 애플리케이션을 개발하고 배포하려면 특수 라이브러리 및 플랫폼을 활용해야 합니다.

  • 라이브러리: spaCyNLTK와 같은 오픈 소스 라이브러리는 토큰화, 구문 분석 및 개체 인식과 같은 일반적인 NLP 작업을 위한 도구를 제공합니다.
  • 플랫폼: Hugging Face는 개발을 크게 가속화하는 방대한 저장소의 사전 훈련된 모델(특히 Transformers), 데이터 세트 및 도구를 제공합니다. NLP에 사용되거나 CV-NLP 파이프라인과 결합된 ML 모델을 포함하여 ML 모델의 엔드 투 엔드 수명주기를 관리하기 위해 Ultralytics HUB와 같은 플랫폼은 강력한 MLOps 기능을 제공하여 훈련, 배포 및 모니터링을 간소화합니다. 모델 개발 및 배포에 대한 더 많은 리소스는 Ultralytics 문서를 참조하십시오.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.