Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Nhận dạng thực thể có tên (Named Entity Recognition - NER)

Khai phá thông tin chi tiết với Nhận dạng thực thể có tên (NER). Khám phá cách AI chuyển đổi văn bản phi cấu trúc thành dữ liệu hữu ích cho các ứng dụng đa dạng.

Nhận dạng Thực thể Có Tên (NER) là một nhiệm vụ phụ quan trọng trong lĩnh vực Xử lý Ngôn ngữ Tự nhiên (NLP) rộng lớn hơn, tập trung vào việc xác định và phân loại các thực thể cụ thể trong văn bản phi cấu trúc. Bằng cách phân tích chuỗi từ, thuật toán NER định vị và phân loại các mục thành các nhóm được xác định trước như tên cá nhân, tổ chức, địa điểm, mã y tế, biểu thức thời gian và giá trị tiền tệ. Quá trình này chuyển đổi văn bản thô thành thông tin có cấu trúc, cho phép các hệ thống Trí tuệ Nhân tạo (AI) hiểu được "ai, cái gì và ở đâu" của một tài liệu. Khi các tổ chức ngày càng phụ thuộc vào lượng dữ liệu khổng lồ, NER đóng vai trò là một bước cơ bản trong việc chuyển đổi dữ liệu phi cấu trúc thành những thông tin chi tiết hữu ích cho phân tích và tự động hóa.

Cách thức hoạt động của Nhận dạng thực thể được đặt tên

Về cốt lõi, NER dựa trên các mô hình thống kê và kỹ thuật Học máy (ML) để phân biệt các mẫu trong ngôn ngữ. Các hệ thống ban đầu sử dụng các phương pháp tiếp cận dựa trên quy tắc và từ điển, nhưng các triển khai hiện đại chủ yếu sử dụng Học sâu (DL)Mạng nơ-ron (NN) . Các mô hình tiên tiến này được đào tạo trên khối lượng lớn văn bản có chú thích, cho phép chúng học các manh mối ngữ cảnh và đặc điểm ngôn ngữ.

Các hệ thống NER tiên tiến thường tận dụng kiến trúc Transformer , chẳng hạn như các kiến trúc được tìm thấy trong Mô hình Ngôn ngữ Lớn (LLM) . Bằng cách sử dụng các cơ chế như tự chú ý , các mô hình này phân tích mối quan hệ giữa các từ trong toàn bộ câu, cải thiện đáng kể độ chính xác so với các phương pháp cũ. Hiệu suất của hệ thống NER phụ thuộc rất nhiều vào chất lượng dữ liệu huấn luyện và độ chính xác của quá trình chú thích dữ liệu ban đầu.

Các Ứng dụng Thực tế

NER đóng vai trò là xương sống cho nhiều ứng dụng thông minh trong nhiều ngành công nghiệp khác nhau.

  • Phân tích Y tế và Y sinh: Trong lĩnh vực y tế, NER trích xuất dữ liệu thiết yếu từ các ghi chú lâm sàng và bài báo nghiên cứu, chẳng hạn như triệu chứng, tên thuốc và liều lượng. Khả năng này hỗ trợ AI trong chăm sóc sức khỏe bằng cách hợp lý hóa việc quản lý hồ sơ bệnh nhân và tạo điều kiện cho các nghiên cứu dịch tễ học quy mô lớn.
  • Tìm kiếm và Đề xuất Nâng cao: Các công cụ tìm kiếm sử dụng NER để hiểu ý định đằng sau truy vấn của người dùng. Bằng cách xác định các thực thể như "Nike" (Thương hiệu) và "Giày chạy bộ" (Danh mục sản phẩm), nền tảng có thể cung cấp kết quả tìm kiếm ngữ nghĩa chính xác. Tương tự, hệ thống đề xuất sử dụng các thực thể được trích xuất để đề xuất nội dung hoặc sản phẩm phù hợp với sở thích của người dùng.
  • Hỗ trợ khách hàng tự động: Nền tảng dịch vụ khách hàng sử dụng NER để tự động định tuyến phiếu hỗ trợ. Việc nhận dạng các thực thể như mẫu sản phẩm hoặc ngày bảo hành cho phép chatbot giải quyết vấn đề của người dùng ngay lập tức hoặc chuyển đến đúng nhân viên hỗ trợ, giúp cải thiện trải nghiệm tổng thể của khách hàng .

Triển khai NER với Python

Trong khi Ultralytics Chuyên về thị giác máy tính, quy trình triển khai các mô hình ML vẫn nhất quán trên nhiều miền. Đối với các tác vụ NER dựa trên văn bản, các nhà phát triển thường sử dụng các thư viện đã được thiết lập sẵn như spaCy . Ví dụ sau đây minh họa cách tải một mô hình đã được đào tạo trước và trích xuất các thực thể từ một câu.

import spacy

# Load the pre-trained English pipeline (requires: python -m spacy download en_core_web_sm)
nlp = spacy.load("en_core_web_sm")

# Process a text string containing entities
text = "Ultralytics launched YOLO11 in Madrid during 2024."
doc = nlp(text)

# Iterate over identified entities and print their labels
for ent in doc.ents:
    print(f"Entity: {ent.text} | Label: {ent.label_}")
# Output examples: 'Ultralytics' (ORG), 'Madrid' (GPE), '2024' (DATE)

NER so với Các khái niệm liên quan

Điều quan trọng là phải phân biệt NER với các cách diễn giải dữ liệu AI khác, đặc biệt là khi thiết kế các quy trình phức tạp.

  • Phát hiện Đối tượng : Trong khi NER xác định các thực thể trong văn bản , phát hiện đối tượng xác định các thực thể (đối tượng) trong hình ảnh hoặc video. Các mô hình như YOLO11 thực hiện một tác vụ trực quan tương đương với NER bằng cách vẽ các hộp giới hạn xung quanh các đối tượng như ô tô hoặc người. Cả hai tác vụ đều hướng đến việc cấu trúc dữ liệu phi cấu trúc—một tác vụ sử dụng pixel, tác vụ còn lại sử dụng token.
  • Phân tích cảm xúc : Nhiệm vụ này phân loại giọng điệu cảm xúc của văn bản (tích cực, tiêu cực, trung tính). NER trích xuất nội dung đang được thảo luận (ví dụ: "iPhone"), trong khi phân tích cảm xúc xác định cảm nhận của người viết về văn bản.
  • Hiểu ngôn ngữ tự nhiên (NLU) : NLU là một thuật ngữ bao quát hơn bao gồm khả năng đọc hiểu máy. NER là một thành phần cụ thể của NLU, cùng với các nhiệm vụ như phân loại ý định và trích xuất quan hệ.
  • Trích xuất từ khóa: Không giống như NER, phân loại các từ thành các danh mục ngữ nghĩa (ví dụ: Người, Ngày), trích xuất từ khóa chỉ xác định các thuật ngữ có liên quan nhất trong tài liệu mà không nhất thiết phải hiểu chúng đại diện cho điều gì.

Công cụ và Nền tảng

Một hệ sinh thái mạnh mẽ hỗ trợ việc phát triển và triển khai các mô hình NER.

  • Thư viện: Các thư viện nguồn mở như NLTK và bộ Stanford CoreNLP cung cấp các công cụ nền tảng cho xử lý văn bản. Các API thương mại như Google Cloud Natural LanguageAmazon Comprehend cung cấp các dịch vụ được quản lý để trích xuất thực thể.
  • Vòng đời mô hình: Việc quản lý đào tạo và triển khai các mô hình AI đòi hỏi các hoạt động hiệu quả. Nền tảng Ultralytics đơn giản hóa các quy trình MLOps này, cung cấp các công cụ để quản lý tập dữ liệu, đào tạo mô hình và triển khai các giải pháp hiệu quả, đảm bảo cả tầm nhìn và các mô hình đa phương thức tiềm năng trong tương lai đều sẵn sàng cho việc sản xuất.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay