Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Nhận dạng thực thể có tên (Named Entity Recognition - NER)

Khám phá Nhận dạng Thực thể Được đặt tên (NER) trong Xử lý Ngôn ngữ Tự nhiên (NLP). Tìm hiểu cách xác định và classify Các thực thể văn bản như tên và ngày tháng để thu thập thông tin chi tiết bằng AI và Ultralytics YOLO26.

Nhận dạng thực thể được đặt tên (NER) là một nhiệm vụ phụ cốt lõi của Xử lý ngôn ngữ tự nhiên (NLP) liên quan đến việc xác định và phân loại thông tin quan trọng trong văn bản phi cấu trúc. Trong quy trình làm việc điển hình, mô hình NER quét tài liệu để định vị "thực thể" - các từ hoặc cụm từ cụ thể đại diện cho các đối tượng trong thế giới thực - và gán chúng vào các danh mục được xác định trước như tên người, tổ chức, địa điểm, ngày tháng hoặc mã y tế. Quá trình này rất cần thiết để chuyển đổi dữ liệu thô, phi cấu trúc như email, đánh giá của khách hàng và bài báo thành các định dạng có cấu trúc mà máy móc có thể xử lý và phân tích. Bằng cách trả lời các câu hỏi "ai, cái gì và ở đâu" của một văn bản, NER cho phép các hệ thống Trí tuệ nhân tạo (AI) tự động trích xuất những hiểu biết có ý nghĩa từ lượng thông tin khổng lồ.

Cách thức hoạt động của NER

Các hệ thống nhận dạng thực thể có tên (NER) hiện đại tận dụng các mô hình thống kê tiên tiến và kỹ thuật Học sâu (DL) để hiểu ngữ cảnh xung quanh một từ. Quá trình này bắt đầu bằng việc phân tách câu thành các đơn vị riêng lẻ gọi là token. Sau đó, các kiến ​​trúc phức tạp, chẳng hạn như Transformer , sẽ phân tích mối quan hệ giữa các token này để xác định ý nghĩa của chúng dựa trên cách sử dụng.

Ví dụ, từ "Apple" có thể dùng để chỉ một loại trái cây hoặc một công ty công nghệ tùy thuộc vào ngữ cảnh. Thông qua các cơ chế như tự chú ý , mô hình nhận dạng thực thể có tên (NER) phân biệt được rằng "Apple đã phát hành một chiếc điện thoại mới" đề cập đến một Tổ chức, trong khi "Tôi đã ăn một quả táo" đề cập đến một đối tượng chung chung. Hiệu suất của các mô hình này phụ thuộc rất nhiều vào dữ liệu huấn luyện chất lượng cao và chú thích dữ liệu chính xác. Trong các ứng dụng đa phương thức, NER thường được kết hợp với Nhận dạng ký tự quang học (OCR) để trích xuất văn bản từ hình ảnh trước khi xử lý.

Các Ứng dụng Thực tế

Nhận dạng thực thể có tên (NER) là một công nghệ nền tảng cho nhiều công cụ tự động hóa thông minh được sử dụng trong nhiều ngành công nghiệp khác nhau.

  • AI trong chăm sóc sức khỏe : Các cơ sở y tế sử dụng NER để khai thác hồ sơ sức khỏe điện tử nhằm tìm kiếm dữ liệu quan trọng. Bằng cách trích xuất các thực thể như triệu chứng, tên thuốc và liều lượng từ ghi chú lâm sàng, các nhà nghiên cứu có thể đẩy nhanh quá trình khám phá thuốc và cải thiện chăm sóc bệnh nhân .
  • Hỗ trợ khách hàng thông minh: Các công ty sử dụng chatbot được trang bị NER để tự động hóa classify Khiếu nại của khách hàng. Nếu người dùng gửi tin nhắn, "Màn hình máy tính xách tay của tôi bị hỏng," hệ thống sẽ xác định "máy tính xách tay" là Sản phẩm và "màn hình bị hỏng" là Lỗi, chuyển yêu cầu đến nhóm hỗ trợ kỹ thuật ngay lập tức.
  • Đề xuất nội dung: Các dịch vụ phát trực tuyến và trình tổng hợp tin tức sử dụng NER để gắn thẻ nội dung với các thực thể có liên quan (ví dụ: diễn viên, thể loại, địa điểm). Sau đó, hệ thống đề xuất sử dụng các thẻ này để gợi ý các bộ phim hoặc bài viết mới phù hợp với sở thích của người dùng.
  • Phân tích tài chính: Các công ty đầu tư sử dụng NER để quét hàng ngàn báo cáo tài chính và bài báo mỗi ngày. Bằng cách trích xuất tên công ty và giá trị tiền tệ, họ có thể thực hiện mô hình dự đoán để dự báo xu hướng thị trường.

Phân biệt NER với các khái niệm liên quan

Việc phân biệt NER với các nhiệm vụ diễn giải khác rất hữu ích để hiểu vai trò cụ thể của nó trong quy trình AI.

  • Phát hiện đối tượng : Trong khi NER xác định các thực thể trong văn bản, phát hiện đối tượng xác định các thực thể trong hình ảnh. Ví dụ, một mô hình hình ảnh như YOLO26 phát hiện ô tô và người đi bộ trong nguồn cấp dữ liệu video, trong khi NER phát hiện "Ford" và "tài xế" trong các báo cáo bằng văn bản. Cả hai nhiệm vụ đều nhằm mục đích định vị và classify các mục quan tâm trong các phương thức dữ liệu tương ứng của chúng.
  • Phân tích cảm xúc : Nhiệm vụ này xác định sắc thái cảm xúc (tích cực, tiêu cực hoặc trung tính) của một văn bản. Nhận dạng thực thể có tên (NER) trích xuất nội dung đang được thảo luận (ví dụ: "iPhone 16"), trong khi phân tích cảm xúc xác định cảm nhận của người dùng về nội dung đó (ví dụ: "thật tuyệt vời").
  • Hiểu ngôn ngữ tự nhiên (NLU) : NLU là thuật ngữ bao quát rộng hơn cho khả năng hiểu văn bản bằng máy. Nhận dạng thực thể có tên (NER) là một thành phần cụ thể của NLU, thường hoạt động cùng với phân loại ý định để nắm bắt đầy đủ ý nghĩa của đầu vào từ người dùng.
  • Trích xuất từ ​​khóa: Không giống như NER, vốn phân loại từ ngữ thành các danh mục ngữ nghĩa (ví dụ: Người, Ngày), trích xuất từ ​​khóa chỉ đơn giản là xác định các thuật ngữ xuất hiện thường xuyên nhất hoặc có liên quan nhất trong một tài liệu mà không cần hiểu loại thực thể của chúng.

Kết hợp nhận dạng thực thể có tên (NER) với thị giác máy tính

Sự kết hợp giữa văn bản và hình ảnh là một xu hướng đang phát triển trong Học tập Đa phương thức . Các mô hình như YOLO -World thu hẹp khoảng cách này bằng cách sử dụng các gợi ý văn bản để hướng dẫn phát hiện đối tượng. Trong quy trình này, bộ mã hóa văn bản hoạt động tương tự như một hệ thống nhận dạng thực thể có tên (NER), diễn giải ý nghĩa ngữ nghĩa của tên lớp (thực thể) do người dùng cung cấp để tìm các đối tượng hình ảnh tương ứng.

Sau đây là Python ví dụ minh họa cách sử dụng ultralytics thư viện đến detect các đối tượng dựa trên mô tả văn bản tùy chỉnh, liên kết hiệu quả các thực thể ngôn ngữ tự nhiên với dữ liệu trực quan.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Công Cụ và Triển khai

Các nhà phát triển có quyền truy cập vào một hệ sinh thái công cụ mạnh mẽ để triển khai NER. Các thư viện mã nguồn mở phổ biến như spaCyNLTK cung cấp các pipeline được huấn luyện sẵn để sử dụng ngay lập tức. Đối với các ứng dụng quy mô doanh nghiệp, các dịch vụ đám mây như Google Cloud Natural Language cung cấp các API được quản lý có khả năng mở rộng theo nhu cầu.

Quản lý vòng đời của các mô hình AI này—cho dù là xử lý văn bản hay hình ảnh—đòi hỏi các hoạt động hiệu quả. Nền tảng Ultralytics đơn giản hóa các quy trình MLOps này, cung cấp một môi trường thống nhất để quản lý tập dữ liệu, huấn luyện mô hình và triển khai giải pháp. Điều này đảm bảo các dự án AI luôn có khả năng mở rộng và sẵn sàng cho sản xuất, hỗ trợ việc cải tiến liên tục các mô hình như YOLO26 để đạt hiệu suất tiên tiến.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay