Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Nhận dạng lại đối tượng (Re-ID)

Tìm hiểu cách Nhận dạng lại đối tượng (Re-ID) khớp danh tính giữa các khung hình camera. Khám phá cách sử dụng Ultralytics YOLO26 và BoT-SORT được sử dụng để theo dõi hình ảnh mạnh mẽ.

Nhận dạng lại đối tượng (Re-ID) là một nhiệm vụ chuyên biệt trong thị giác máy tính (CV) được thiết kế để đối sánh một đối tượng hoặc cá nhân cụ thể trên các góc nhìn camera khác nhau không chồng chéo hoặc trong thời gian dài. Trong khi phát hiện đối tượng tiêu chuẩn tập trung vào việc nhận dạng loại thực thể—xác định rằng một hình ảnh chứa "người" hoặc "ô tô"—thì Re-ID tiến thêm một bước bằng cách xác định đó là người hoặc ô tô cụ thể nào dựa trên hình ảnh trực quan. Khả năng này rất cần thiết để tạo ra một câu chuyện chuyển động mạch lạc trong môi trường quy mô lớn, nơi một camera duy nhất không thể bao phủ toàn bộ khu vực, giúp kết nối hiệu quả các điểm giữa các quan sát hình ảnh riêng lẻ.

Quy trình xác định lại danh tính hoạt động như thế nào?

Thách thức cốt lõi của việc xác thực lại danh tính (Re-ID) là duy trì tính nhất quán của danh tính bất chấp sự thay đổi về ánh sáng, góc máy ảnh, tư thế và các yếu tố gây nhiễu trong bối cảnh. Để đạt được điều này, hệ thống thường sử dụng một quy trình nhiều bước liên quan đến mạng nơ-ron sâu.

  • Trích xuất đặc trưng: Sau khi một đối tượng được phát hiện, mạng nơ-ron tích chập (CNN) sẽ phân tích vùng ảnh đã cắt để tạo ra một vectơ đặc trưng, ​​thường được gọi là embedding . Vectơ này là một biểu diễn số dày đặc về các đặc điểm hình ảnh độc đáo của đối tượng, chẳng hạn như kết cấu quần áo hoặc màu sắc xe cộ.
  • Học ma trận khoảng cách: Các mô hình cơ bản được huấn luyện bằng kỹ thuật học ma trận khoảng cách. Mục tiêu là đảm bảo rằng các embedding của cùng một đối tượng nằm gần nhau về mặt toán học trong không gian vector, trong khi các embedding của các đối tượng khác nhau lại nằm cách xa nhau. Các kiến ​​trúc chuyên biệt như mạng nơ-ron Siamese thường được sử dụng để học các mối quan hệ này.
  • So khớp độ tương đồng: Trong quá trình triển khai, hệ thống so sánh phần nhúng của đối tượng truy vấn với một thư viện các định danh đã được lưu trữ. Việc so sánh này thường bao gồm tính toán độ tương đồng cosine hoặc khoảng cách Euclidean . Nếu điểm số tương đồng vượt qua ngưỡng được xác định trước, hệ thống sẽ xác nhận sự trùng khớp.

Re-ID so với Theo dõi đối tượng

Điều quan trọng là phải phân biệt giữa nhận dạng lại đối tượng (Re-ID) và theo dõi đối tượng , vì chúng đóng vai trò bổ sung nhưng khác biệt trong quy trình xử lý hình ảnh.

  • Theo dõi đối tượng: Quá trình này dựa trên tính liên tục theo thời gian. Các thuật toán như bộ lọc Kalman dự đoán vị trí tương lai của đối tượng trong khung hình tiếp theo dựa trên vận tốc và quỹ đạo hiện tại của nó. Nó thường sử dụng giao điểm trên hợp nhất ( IoU ) để liên kết các phát hiện trong các khung hình liền kề.
  • Nhận dạng lại: Nhận dạng lại rất quan trọng khi tính liên tục về mặt thời gian bị gián đoạn. Điều này xảy ra trong trường hợp bị che khuất—khi một vật thể bị che khuất bởi vật cản—hoặc khi một vật thể rời khỏi tầm nhìn của một camera và đi vào tầm nhìn của camera khác. Nhận dạng lại thiết lập lại danh tính dựa trên hình dạng bên ngoài chứ không phải lịch sử vị trí, cho phép theo dõi nhiều đối tượng (MOT) mạnh mẽ.

Các Ứng dụng Thực tế

Khả năng duy trì tính nhất quán giữa các giao diện khác nhau cho phép thực hiện phân tích chuyên sâu trong nhiều ngành công nghiệp.

  • Quản lý giao thông thành phố thông minh: Trong bối cảnh trí tuệ nhân tạo (AI) tại các thành phố thông minh , Re-ID cho phép các hệ thống đô thị track Một phương tiện di chuyển qua mạng lưới giao lộ rộng khắp thành phố. Điều này giúp tính toán thời gian di chuyển trung bình và tối ưu hóa thời gian điều chỉnh đèn giao thông mà không chỉ dựa vào nhận dạng biển số xe .
  • Phân tích hành vi khách hàng bán lẻ: Các nhà bán lẻ sử dụng Re-ID để hiểu hành vi mua sắm của khách hàng. Bằng cách liên kết các lần xuất hiện của khách hàng trên các lối đi khác nhau, các cửa hàng có thể tạo ra bản đồ nhiệt về các tuyến đường phổ biến. Điều này giúp tối ưu hóa bố cục cửa hàng và số lượng nhân viên, cung cấp thông tin chi tiết về toàn bộ hành trình của khách hàng chứ không chỉ là các tương tác riêng lẻ.

Triển khai tính năng theo dõi với chức năng nhận dạng lại

Các quy trình AI thị giác hiện đại thường kết hợp các bộ dò hiệu năng cao với các hệ thống theo dõi sử dụng khái niệm Nhận dạng lại (Re-ID). Mô hình YOLO26 có thể được tích hợp liền mạch với các hệ thống theo dõi như BoT-SORT, hệ thống này tận dụng các đặc điểm ngoại hình để duy trì nhận dạng. track Tính nhất quán. Đối với người dùng muốn quản lý tập dữ liệu và quy trình huấn luyện một cách hiệu quả, Nền tảng Ultralytics cung cấp giao diện thống nhất để chú thích và triển khai.

Ví dụ sau đây minh họa cách thực hiện theo dõi đối tượng bằng cách sử dụng Ultralytics Python gói phần mềm quản lý tính toàn vẹn danh tính một cách tự động:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Track objects in a video file
# The 'persist=True' argument is vital for maintaining IDs across frames
# BoT-SORT is a tracker that can utilize appearance features for Re-ID
results = model.track(
    source="https://www.ultralytics.com/blog/ultralytics-yolov8-for-speed-estimation-in-computer-vision-projects",
    tracker="botsort.yaml",
    persist=True,
)

# Print the unique ID assigned to the first detected object in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked Object ID: {results[0].boxes.id[0].item()}")

Để đạt hiệu suất mạnh mẽ, việc huấn luyện các mô hình này đòi hỏi dữ liệu huấn luyện chất lượng cao. Các kỹ thuật như hàm mất mát bộ ba (triplet loss) thường được sử dụng trong quá trình huấn luyện các mô-đun con Re-ID cụ thể để tinh chỉnh khả năng phân biệt của các embedding. Hiểu rõ các sắc thái của độ chính xác (precision) và độ thu hồi (recall) cũng rất quan trọng khi đánh giá mức độ hiệu quả của hệ thống Re-ID trong việc tránh các kết quả trùng khớp sai.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay