Yolo 비전 선전
선전
지금 참여하기
용어집

개체명 인식(NER)

개체명 인식(NER)으로 인사이트를 얻으세요. AI가 다양한 애플리케이션을 위해 비정형 텍스트를 실행 가능한 데이터로 어떻게 변환하는지 알아보세요.

명명된 엔티티 인식(NER)은 다음과 같은 광범위한 분야에서 중요한 하위 작업입니다. 자연어 처리(NLP) 의 중요한 하위 작업으로, 비정형 텍스트 내에서 특정 엔티티를 식별하고 분류하는 데 중점을 둡니다. 단어의 시퀀스를 분석하여 단어의 시퀀스를 분석하여 NER 알고리즘은 개인 이름, 조직, 의료 코드, 시간 표현 등 미리 정의된 그룹으로 항목을 찾아 분류합니다, 위치, 의료 코드, 시간 표현, 금전적 가치 등 사전 정의된 그룹으로 분류합니다. 이 프로세스는 원시 텍스트를 구조화된 정보로 변환하여 인공 지능(AI) 시스템 문서의 '누가, 무엇을, 어디에 있는지'를 이해할 수 있습니다. 조직이 점점 더 방대한 양의 데이터에 의존함에 따라 데이터에 점점 더 의존함에 따라, NER은 비구조화 데이터를 비정형 데이터를 실행 가능한 인사이트로 전환하는 기본 단계 역할을 합니다. 분석 및 자동화.

네임드 엔티티 인식의 작동 방식

NER의 핵심은 통계 모델과 머신 러닝(ML) 기술을 사용하여 언어의 패턴을 식별합니다. 초기 시스템에서는 규칙 기반 접근 방식과 사전을 사용했지만, 최신 구현에서는 은 주로 딥 러닝(DL)신경망(NN)을 주로 활용합니다. 이러한 고급 모델은 주석이 달린 방대한 텍스트 코퍼스를 학습하여 문맥적 단서와 언어적 특징을 학습할 수 있습니다.

최첨단 NER 시스템은 종종 다음을 활용합니다. 다음과 같은 트랜스포머 아키텍처를 활용합니다 . LLM(대규모 언어 모델)을 활용합니다. 이러한 모델은 이러한 모델은 자기 주의와 같은 메커니즘을 사용하여 전체 문장에서 단어 간의 관계를 분석하여 기존 방식에 비해 정확도를 크게 향상시킵니다. NER 시스템의 NER 시스템의 성능은 학습 데이터의 품질에 따라 크게 달라집니다. 훈련 데이터의 품질과 초기 데이터 주석 프로세스의 정밀도에 따라 크게 달라집니다.

실제 애플리케이션

NER은 다양한 산업 분야의 많은 지능형 애플리케이션을 위한 백본 역할을 합니다.

  • 의료 및 생물의학 분석: 의료 분야에서 NER은 임상 기록과 연구 논문에서 필수 데이터를 추출합니다. 증상, 약품명, 복용량 등 임상 노트와 연구 논문에서 필수 데이터를 추출합니다. 이 기능은 다음을 지원합니다. 환자 기록 간소화를 통한 의료 분야의 AI 관리를 간소화하고 대규모 역학 연구.
  • 향상된 검색 및 추천: 검색 엔진은 NER을 활용하여 사용자의 쿼리 의도를 파악합니다. 의도를 파악합니다. 'Nike'(브랜드), '운동화'(제품 카테고리)와 같은 실체를 식별함으로써 플랫폼은 정확한 시맨틱 검색 결과를 제공할 수 있습니다. 마찬가지로 추천 시스템은 추출된 엔티티를 사용하여 사용자 관심사에 맞는 콘텐츠나 제품을 제안합니다.
  • 자동화된 고객 지원: 고객 서비스 플랫폼은 NER을 사용하여 지원 티켓을 자동으로 자동으로 라우팅합니다. 제품 모델이나 보증 기간과 같은 엔티티를 인식하여 챗봇이 사용자 문제를 즉시 해결하거나 에스컬레이션하여 올바른 상담원에게 에스컬레이션하여 전반적인 고객 경험을 개선합니다.

Python NER 구현하기

Ultralytics 컴퓨터 비전에 특화되어 있지만, ML 모델을 배포하는 워크플로는 여러 도메인에 걸쳐 일관되게 유지됩니다. 도메인. 텍스트 기반 NER 작업의 경우, 개발자는 종종 다음과 같은 기존 라이브러리를 사용합니다. spaCy. 다음 예는 사전 학습된 모델을 로드하고 문장으로부터 엔티티를 추출하는 방법을 보여줍니다.

import spacy

# Load the pre-trained English pipeline (requires: python -m spacy download en_core_web_sm)
nlp = spacy.load("en_core_web_sm")

# Process a text string containing entities
text = "Ultralytics launched YOLO11 in Madrid during 2024."
doc = nlp(text)

# Iterate over identified entities and print their labels
for ent in doc.ents:
    print(f"Entity: {ent.text} | Label: {ent.label_}")
# Output examples: 'Ultralytics' (ORG), 'Madrid' (GPE), '2024' (DATE)

NER과 관련 개념 비교

특히 복잡한 파이프라인을 설계할 때는 NER을 다른 AI의 데이터 해석과 구별하는 것이 중요합니다. 파이프라인을 설계할 때 특히 그렇습니다.

  • 객체 감지: NER 는 텍스트의 개체를 식별하는 반면, 개체 감지는 이미지 또는 비디오의 개체(객체)를 식별합니다. 다음과 같은 모델 YOLO11 와 같은 모델은 다음과 같은 방법으로 NER과 시각적으로 동등한 기능을 수행합니다. 자동차나 사람 같은 객체 주위에 경계 상자를 그려서 사람. 두 작업 모두 비정형 데이터를 구조화하는 것을 목표로 하는데, 하나는 픽셀을 사용하고 다른 하나는 토큰을 사용합니다.
  • 감정 분석: 이 작업 는 텍스트의 감정 어조(긍정, 부정, 중립)를 분류합니다. NER은 논의 중인 내용을 추출합니다. (예: "아이폰")을 추출하는 반면, 감정 분석은 작성자가 이에 대해 어떻게 느끼는지를 결정합니다.
  • 자연어 이해(NLU): NLU는 기계 독해력을 포괄하는 광범위한 용어입니다. NER은 NLU의 특정 구성 요소입니다, 인텐트 분류 및 관계 추출과 같은 작업과 함께 사용됩니다.
  • 키워드 추출: 단어를 의미론적 범주(예: 사람, 날짜), 키워드 추출은 단순히 문서에서 가장 관련성이 높은 용어를 식별합니다. 문서에서 가장 관련성이 높은 용어를 식별할 뿐입니다.

도구 및 플랫폼

강력한 에코시스템이 NER 모델의 개발과 배포를 지원합니다.

  • 라이브러리: NLTK와 같은 오픈 소스 라이브러리와 Stanford CoreNLP 제품군은 텍스트 처리를 위한 기본 도구를 제공합니다. 처리를 위한 기본 도구를 제공합니다. 다음과 같은 상용 API Google 클라우드 자연어Amazon Comprehend와 같은 상용 API는 엔티티 추출을 위한 관리형 서비스를 제공합니다.
  • 모델 수명 주기: AI 모델의 학습 및 배포를 관리하려면 효율적인 운영이 필요합니다. Ultralytics 플랫폼은 이러한 MLOps 프로세스를 간소화하여 데이터 세트 관리, 모델 학습, 솔루션 배포를 효과적으로 수행하여 비전과 잠재적인 미래 모두를 보장합니다. 멀티모달 모델을 프로덕션에 바로 사용할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기