Nâng cao khả năng nhận dạng lại xe với Ultralytics YOLO các mô hình
Tìm hiểu cách Ultralytics YOLO Các mô hình có thể đóng vai trò trong các giải pháp nhận dạng lại phương tiện bằng cách cung cấp khả năng phát hiện chính xác và rõ ràng.

Tìm hiểu cách Ultralytics YOLO Các mô hình có thể đóng vai trò trong các giải pháp nhận dạng lại phương tiện bằng cách cung cấp khả năng phát hiện chính xác và rõ ràng.

Khi xem một cuộc đua Công thức 1 , bạn sẽ dễ dàng nhận ra chiếc xe của đội đua yêu thích. Màu đỏ rực của Ferrari hay màu bạc của Mercedes nổi bật qua từng vòng đua.
Yêu cầu một cỗ máy làm điều tương tự, không phải trên đường đua sạch sẽ mà trên những con phố đông đúc, chật kín xe cộ, thì khó khăn hơn nhiều. Đó là lý do tại sao việc nhận dạng lại phương tiện (vehicle re-ID) đang thu hút sự chú ý trong lĩnh vực AI gần đây.
Nhận dạng lại phương tiện cho phép máy móc nhận dạng cùng một phương tiện qua nhiều camera góc nhìn khác nhau hoặc không chồng lấn. Công nghệ này cũng giúp nhận dạng phương tiện sau khi bị che khuất tạm thời (khi phương tiện bị che khuất một phần) hoặc thay đổi ánh sáng và góc nhìn.
Công nghệ cốt lõi hỗ trợ nhận dạng lại xe là thị giác máy tính . Thị giác máy tính là một lĩnh vực của trí tuệ nhân tạo, tập trung vào việc dạy máy móc hiểu và diễn giải thông tin trực quan, chẳng hạn như hình ảnh và video. Sử dụng công nghệ này, các hệ thống AI có thể phân tích các đặc điểm của xe và track chúng một cách đáng tin cậy trên các mạng camera lớn cho các ứng dụng như giám sát đô thị và giám sát giao thông.
Đặc biệt, các mô hình Vision AI như Ultralytics YOLO11 và Ultralytics YOLO26 sắp ra mắt hỗ trợ các tác vụ như phát hiện và theo dõi đối tượng. Chúng có thể nhanh chóng định vị xe trong từng khung hình và theo dõi chuyển động của chúng trong toàn cảnh. Khi các mô hình này được kết hợp với mạng lưới nhận dạng lại xe, hệ thống kết hợp có thể nhận dạng cùng một xe trên nhiều nguồn cấp dữ liệu camera khác nhau, ngay cả khi góc nhìn hoặc điều kiện ánh sáng thay đổi.

Trong bài viết này, chúng ta sẽ tìm hiểu cách thức hoạt động của công nghệ nhận dạng lại phương tiện, công nghệ giúp thực hiện điều này và ứng dụng của nó trong các hệ thống giao thông thông minh. Hãy cùng bắt đầu nhé!
Nhận dạng lại phương tiện là một ứng dụng quan trọng trong thị giác máy tính . Nó tập trung vào việc nhận dạng cùng một phương tiện khi nó xuất hiện qua các camera khác nhau, không chồng chéo, đồng thời duy trì tính nhất quán của nhận dạng khi di chuyển trong thành phố. Điều này rất khó khăn vì mỗi camera có thể chụp phương tiện từ một góc độ khác nhau, dưới ánh sáng khác nhau, hoặc bị che khuất một phần.
Hãy xem xét một tình huống trong đó một chiếc xe sedan màu xanh đi qua ngã tư và sau đó xuất hiện trên một con phố khác, được một camera khác theo dõi. Góc nhìn, ánh sáng và phông nền đều đã thay đổi, và các xe khác có thể che khuất tầm nhìn trong giây lát. Mặc dù vậy, hệ thống nhận dạng lại xe vẫn cần xác định đó là cùng một xe.
Những tiến bộ gần đây trong học sâu, đặc biệt là với mạng nơ-ron tích chập (CNN) và các mô hình dựa trên bộ biến đổi, đã giúp quá trình này chính xác hơn nhiều. Các mô hình này có thể trích xuất các mẫu hình ảnh có ý nghĩa và phân biệt giữa các phương tiện trông giống nhau, đồng thời vẫn xác định được phương tiện chính xác.
Trong các hệ thống giao thông thông minh, khả năng này hỗ trợ giám sát liên tục, tái tạo tuyến đường và phân tích giao thông toàn thành phố, giúp hệ thống thành phố thông minh có cái nhìn rõ nét hơn về cách thức di chuyển của phương tiện. Chúng giúp cải thiện an toàn và hiệu quả.
Thông thường, các cảnh quay video từ giao lộ, bãi đỗ xe và đường cao tốc được phân tích bằng kỹ thuật nhận dạng lại xe để xác định xem cùng một xe có xuất hiện trên các camera khác nhau hay không. Khái niệm này tương tự như nhận dạng lại người, trong đó các hệ thống track cá nhân trên nhiều góc nhìn khác nhau, nhưng ở đây trọng tâm là phân tích các đặc điểm cụ thể của xe thay vì ngoại hình con người.
Quá trình thực hiện như vậy bao gồm một số bước chính, mỗi bước được thiết kế để giúp hệ thống detect xe cộ, trích xuất các đặc điểm trực quan của chúng và so sánh chúng một cách đáng tin cậy trên nhiều góc nhìn khác nhau.
Ở cấp độ cao hơn, hệ thống đầu tiên phát hiện các phương tiện trong mỗi khung hình, sau đó trích xuất các đặc điểm như màu sắc, hình dạng và kết cấu để tạo ra một biểu diễn kỹ thuật số duy nhất, hay còn gọi là nhúng, cho từng phương tiện. Các nhúng này được so sánh theo thời gian và giữa các camera, thường được hỗ trợ bởi tính năng theo dõi vật thể và kiểm tra không gian-thời gian, để quyết định xem hai lần nhìn thấy có thuộc về cùng một phương tiện hay không.

Sau đây là cái nhìn sâu hơn về quá trình này:
Ultralytics YOLO Các mô hình đóng vai trò hỗ trợ quan trọng trong quy trình nhận dạng lại xe. Mặc dù chúng không tự thực hiện Re-ID, nhưng chúng cung cấp các khả năng thiết yếu khác, chẳng hạn như phát hiện nhanh và theo dõi ổn định, mà mạng lưới Re-ID phụ thuộc vào để khớp chính xác giữa các camera.
Tiếp theo, chúng ta hãy xem xét kỹ hơn về cách Ultralytics YOLO các mô hình như YOLO11 có thể cải thiện hệ thống nhận dạng lại xe.
Nền tảng của bất kỳ hệ thống nhận dạng lại phương tiện nào là khả năng phát hiện vật thể chính xác. Ultralytics YOLO các mô hình như YOLO11 là một lựa chọn tuyệt vời cho việc này, vì chúng có thể nhanh chóng detect xe cộ trong mỗi khung hình, ngay cả trong những cảnh đông đúc với sự che khuất một phần, giao thông đông đúc hoặc điều kiện ánh sáng thay đổi.
Chúng cũng có thể được huấn luyện tùy chỉnh, nghĩa là bạn có thể tinh chỉnh mô hình trên tập dữ liệu của riêng mình để nó học cách nhận dạng các loại phương tiện cụ thể, chẳng hạn như taxi, xe tải giao hàng hoặc xe đội. Điều này đặc biệt hữu ích khi một giải pháp yêu cầu phát hiện chuyên biệt hơn. Bằng cách cung cấp các hộp giới hạn rõ ràng, chính xác, Ultralytics YOLO các mô hình cung cấp cho mạng lưới Re-ID các dữ liệu đầu vào chất lượng cao để hoạt động, giúp kết hợp đáng tin cậy hơn giữa các camera.
Khi phát hiện ra các phương tiện, các mô hình như YOLO11 cũng có thể hỗ trợ theo dõi đối tượng ổn định trong một góc nhìn camera duy nhất. Theo dõi đối tượng là quá trình theo dõi một phương tiện đã được phát hiện qua các khung hình liên tiếp và gán cho nó một ID nhất quán khi nó di chuyển.
Với sự hỗ trợ tích hợp cho các thuật toán theo dõi như ByteTrack và BoT-SORT trong gói Python Ultralytics , YOLO11 có thể duy trì ID nhất quán khi xe di chuyển qua hiện trường. Tính năng theo dõi ổn định này giúp giảm thiểu việc chuyển đổi danh tính trước khi hệ thống Re-ID tiếp quản, từ đó cải thiện độ chính xác của việc khớp lệnh giữa các camera.
Ngoài việc theo dõi chuyển động tiêu chuẩn, Ultralytics Python Gói này bao gồm các tính năng Re-ID dựa trên ngoại hình tùy chọn trong bộ theo dõi BoT-SORT. Điều này có nghĩa là bộ theo dõi có thể sử dụng các đặc điểm ngoại hình, chứ không chỉ dựa trên các mẫu chuyển động hoặc chồng chéo hộp giới hạn, để xác định xem hai phát hiện có thuộc về cùng một phương tiện hay không.
Khi được kích hoạt, BoT-SORT trích xuất các nhúng hình dạng nhẹ từ máy dò hoặc từ YOLO11 Mô hình phân loại và sử dụng chúng để xác minh danh tính giữa các khung hình. Tín hiệu xuất hiện bổ sung này giúp thiết bị theo dõi duy trì ID ổn định hơn trong các tình huống khó khăn, chẳng hạn như che khuất tạm thời, xe cộ chạy sát nhau hoặc dịch chuyển nhỏ do chuyển động của camera.
Mặc dù tính năng Re-ID tích hợp này không nhằm mục đích thay thế hoàn toàn việc nhận dạng lại xe qua camera chéo, nhưng nó cải thiện tính nhất quán danh tính trong một góc nhìn camera duy nhất và tạo ra các đường dẫn rõ ràng hơn mà các mô-đun Re-ID hạ nguồn có thể dựa vào. Để sử dụng các tính năng theo dõi dựa trên ngoại hình này, bạn chỉ cần bật Re-ID trong tệp cấu hình trình theo dõi BoT-SORT bằng cách đặt "with_reid" thành "True" và chọn mẫu xe sẽ cung cấp các tính năng ngoại hình.
Để biết thêm chi tiết, bạn có thể kiểm tra Ultralytics trang tài liệu về theo dõi đối tượng , giải thích các tùy chọn Re-ID có sẵn và cách cấu hình chúng.
Ngoài việc cải thiện tính ổn định của danh tính trong quá trình theo dõi, YOLO các mô hình cũng đóng vai trò quan trọng trong việc chuẩn bị dữ liệu đầu vào trực quan rõ ràng cho chính mạng lưới Re-ID.
Sau khi phát hiện xe, hộp giới hạn của xe thường được cắt và gửi đến mạng nhận dạng lại, nơi trích xuất các đặc điểm hình ảnh cần thiết để so khớp. Do các mô hình nhận dạng lại phụ thuộc rất nhiều vào các hình ảnh được cắt này, nên các dữ liệu đầu vào kém, chẳng hạn như hình ảnh bị mờ, không thẳng hàng hoặc không đầy đủ, có thể dẫn đến việc nhúng yếu hơn và việc so khớp giữa các camera kém tin cậy hơn.
Ultralytics YOLO Các mô hình giúp giảm thiểu những vấn đề này bằng cách liên tục tạo ra các khung giới hạn rõ ràng, được căn chỉnh tốt, giúp nắm bắt toàn bộ chiếc xe quan tâm. Với khả năng cắt ảnh rõ nét và chính xác hơn, mạng lưới Re-ID có thể tập trung vào các chi tiết có ý nghĩa như màu sắc, hình dạng, kết cấu và các đặc điểm nổi bật khác. Đầu vào chất lượng cao mang lại hiệu suất Re-ID đáng tin cậy và chính xác hơn trên mọi góc nhìn camera.
Mặc dù Ultralytics YOLO Các mô hình không tự thực hiện nhận dạng lại, chúng cung cấp thông tin quan trọng mà mạng lưới nhận dạng lại cần để so sánh các phương tiện trên các góc nhìn camera khác nhau. Các mô hình như YOLO11 có thể đảm nhiệm việc định vị và theo dõi các phương tiện trong mỗi camera, trong khi mô hình Re-ID xác định xem hai phương tiện cắt từ các địa điểm khác nhau có cùng một danh tính hay không.
Khi các thành phần này hoạt động cùng nhau, YOLO để phát hiện và theo dõi, cùng với một mô hình nhúng chuyên dụng để trích xuất đặc điểm, chúng tạo thành một đường ống khớp xe đa camera hoàn chỉnh. Điều này cho phép liên kết cùng một xe khi nó di chuyển qua một mạng lưới camera lớn hơn.
Ví dụ, trong một nghiên cứu gần đây, các nhà nghiên cứu đã sử dụng một loại vật liệu nhẹ YOLO11 mô hình như máy dò xe trong hệ thống theo dõi đa camera trực tuyến. Nghiên cứu phát hiện ra rằng việc sử dụng YOLO11 giúp giảm thời gian phát hiện mà không làm giảm độ chính xác, giúp cải thiện hiệu suất tổng thể của quá trình theo dõi hạ lưu và khớp nối giữa các camera.

Bây giờ chúng ta đã hiểu rõ hơn về cách Ultralytics YOLO Để hỗ trợ nhận dạng lại xe, hãy cùng xem xét kỹ hơn các mô hình học sâu xử lý các bước trích xuất đặc điểm và so khớp. Các mô hình này chịu trách nhiệm tìm hiểu hình dạng xe, tạo ra các nhúng mạnh mẽ và phân biệt giữa các xe có hình ảnh tương tự nhau trên các góc nhìn camera khác nhau.
Sau đây là một số ví dụ về các thành phần học sâu cốt lõi được sử dụng trong hệ thống nhận dạng lại đối tượng:
Ngoài các thành phần kiến trúc này, học theo hệ mét đóng vai trò quan trọng trong việc huấn luyện các mô hình nhận dạng lại xe. Các hàm mất mát như mất bộ ba, mất tương phản và mất entropy chéo giúp hệ thống học các nhúng phân biệt mạnh bằng cách ghép các hình ảnh của cùng một xe lại với nhau trong khi đẩy các hình ảnh khác ra xa nhau.
Trong nghiên cứu thị giác máy tính, chất lượng của tập dữ liệu có tác động lớn đến hiệu suất của mô hình sau khi triển khai. Tập dữ liệu cung cấp các hình ảnh hoặc video được gắn nhãn mà mô hình học hỏi từ đó.
Để nhận dạng lại phương tiện, các bộ dữ liệu tiên tiến này phải nắm bắt được nhiều điều kiện đa dạng như ánh sáng, thay đổi góc nhìn và biến động thời tiết. Sự đa dạng này giúp các mô hình xử lý được sự phức tạp của môi trường giao thông thực tế.
Sau đây là cái nhìn tổng quan về các tập dữ liệu phổ biến hỗ trợ đào tạo, tối ưu hóa và đánh giá các mô hình nhận dạng lại phương tiện:

Hiệu suất mô hình trên các tập dữ liệu này thường được đánh giá bằng các số liệu như độ chính xác trung bình ( mAP ) và độ chính xác Hạng 1 hoặc Hạng 5. mAP đo lường mức độ chính xác mà mô hình tìm thấy tất cả các kết quả khớp có liên quan cho một phương tiện nhất định, trong khi điểm Hạng 1 và Hạng 5 cho biết kết quả khớp chính xác có xuất hiện ở đầu danh sách kết quả hay trong một vài dự đoán đầu tiên hay không.
Cùng nhau, các tiêu chuẩn này cung cấp cho các nhà nghiên cứu một cách nhất quán để so sánh các phương pháp khác nhau và đóng vai trò quan trọng trong việc hướng dẫn phát triển các hệ thống nhận dạng lại phương tiện chính xác và đáng tin cậy hơn để sử dụng trong thế giới thực.
Sau khi đã nắm được những kiến thức cơ bản, hãy cùng xem xét một số trường hợp sử dụng thực tế trong đó chức năng nhận dạng lại phương tiện hỗ trợ quy trình vận chuyển, di chuyển và giám sát thực tế.
Những con đường đông đúc trong thành phố luôn đông đúc xe cộ qua lại và camera giao thông thường phải vật lộn để theo kịp track của cùng một phương tiện khi di chuyển giữa các khu vực khác nhau. Ánh sáng thay đổi, cảnh đông đúc và các phương tiện trông gần như giống hệt nhau có thể khiến danh tính bị mất qua camera.
Nhận dạng lại phương tiện giải quyết vấn đề này bằng cách phát hiện phương tiện rõ ràng, trích xuất các đặc điểm riêng biệt và duy trì ID nhất quán ngay cả trong các cảnh quay có độ phân giải thấp hoặc đông đúc. Kết quả là việc theo dõi mượt mà và liên tục trên toàn mạng lưới, giúp các đội giao thông có cái nhìn rõ nét hơn về cách phương tiện di chuyển trong thành phố và cho phép phản ứng nhanh hơn, chính xác hơn với tình trạng tắc nghẽn và sự cố.
Các cơ sở đỗ xe thông minh dựa trên việc nhận dạng xe nhất quán để quản lý lối vào, lối ra, kiểm soát truy cập và phân bổ không gian. Tuy nhiên, camera trong những môi trường này thường ghi hình xe từ các góc độ bất thường và trong điều kiện ánh sáng khó khăn, chẳng hạn như trong gara ngầm, khu vực râm mát hoặc bãi đậu xe ngoài trời vào lúc hoàng hôn.
Những điều kiện này khiến việc xác nhận liệu cùng một phương tiện có được nhìn thấy ở các khu vực khác nhau hay không trở nên khó khăn hơn. Khi danh tính không nhất quán, hồ sơ đỗ xe có thể bị phá vỡ, hệ thống kiểm soát ra vào trở nên kém tin cậy hơn và tài xế có thể gặp phải tình trạng chậm trễ. Đó là lý do tại sao nhiều hệ thống đỗ xe thông minh tích hợp các mô hình nhận dạng lại phương tiện để duy trì danh tính ổn định cho mỗi phương tiện khi di chuyển trong bãi đỗ xe.

Ngoài việc giám sát giao thông, việc nhận dạng lại phương tiện cũng đóng vai trò quan trọng trong việc thực thi pháp luật và điều tra pháp y. Trong nhiều trường hợp, cảnh sát cần theo dõi một phương tiện qua nhiều camera, nhưng biển số xe có thể không đọc được, bị mất hoặc bị cố tình che khuất.
Cảnh đông đúc, tầm nhìn hạn chế và che khuất một phần có thể khiến các phương tiện trông giống nhau một cách khó hiểu, khiến việc nhận dạng thủ công trở nên chậm chạp và không đáng tin cậy. Công nghệ nhận dạng lại phương tiện có thể được sử dụng để theo dõi chuyển động của phương tiện trên các mạng lưới camera không chồng lấn bằng cách phân tích các đặc điểm hình ảnh của phương tiện thay vì chỉ dựa vào biển số xe.
Điều này có nghĩa là các điều tra viên có thể dễ dàng theo dõi chuyển động của phương tiện, nắm bắt thời điểm phương tiện xuất hiện ở các địa điểm khác nhau và xác nhận lộ trình trước và sau sự cố. Công nghệ nhận dạng lại phương tiện bằng AI cũng hỗ trợ các tác vụ như theo dõi phương tiện nghi vấn, xem lại cảnh quay sự cố hoặc xác định hướng di chuyển của phương tiện trước hoặc sau sự cố.

Hoạt động của đội tàu và hậu cần thường dựa vào GPS, thẻ RFID và nhật ký thủ công để track chuyển động của xe, nhưng những công cụ này để lại những khoảng trống ở những khu vực được camera an ninh hoặc camera sân bao phủ, chẳng hạn như khu vực bốc dỡ hàng, bãi kho và mạng lưới đường nội bộ.
Các phương tiện thường xuyên di chuyển giữa các camera không chồng lên nhau, ẩn sau các công trình kiến trúc, hoặc trông gần như giống hệt nhau trong đội xe, khiến việc xác nhận xem cùng một phương tiện có được nhìn thấy ở các địa điểm khác nhau hay không trở nên khó khăn. Hệ thống nhận dạng lại phương tiện có thể giúp thu hẹp khoảng cách này bằng cách phân tích các chi tiết hình ảnh và thông tin thời gian để duy trì nhận dạng nhất quán cho mỗi phương tiện khi di chuyển qua cơ sở.
Điều này giúp người quản lý đội xe có cái nhìn toàn diện hơn về hoạt động bên trong trung tâm của họ, hỗ trợ các nhiệm vụ như xác minh đường dẫn giao hàng, xác định chuyển động bất thường và đảm bảo xe đi theo đúng lộ trình dự kiến.
Sau đây là một số lợi ích chính của việc sử dụng công nghệ nhận dạng lại xe bằng AI:
Mặc dù nhận dạng lại phương tiện mang lại nhiều lợi ích, nhưng cũng có một số hạn chế cần cân nhắc. Dưới đây là một số yếu tố ảnh hưởng đến độ tin cậy của nó trong môi trường thực tế:
Việc nhận dạng lại phương tiện đang tiếp tục phát triển cùng với sự phát triển của công nghệ. Các ấn phẩm gần đây từ IEEE, CVPR và arXiv, cùng với các bài thuyết trình tại các hội nghị quốc tế, nhấn mạnh sự chuyển dịch rõ ràng sang các mô hình phong phú hơn, kết hợp nhiều nguồn dữ liệu và khả năng suy luận tính năng tiên tiến hơn. Các nghiên cứu trong tương lai trong lĩnh vực này có thể sẽ tập trung vào việc xây dựng các hệ thống mạnh mẽ, hiệu quả hơn và có khả năng xử lý các biến động thực tế ở quy mô lớn.
Ví dụ, một hướng đi đầy hứa hẹn là sử dụng các mô hình dựa trên bộ biến đổi và mạng lưới tổng hợp đồ thị. Bộ biến đổi có thể phân tích toàn bộ hình ảnh và hiểu cách tất cả các chi tiết hình ảnh khớp với nhau, giúp hệ thống nhận dạng cùng một phương tiện ngay cả khi góc nhìn hoặc ánh sáng thay đổi.
Các mô hình dựa trên đồ thị tiến xa hơn một bước bằng cách xử lý các bộ phận xe hoặc góc nhìn camera khác nhau như các điểm kết nối trong một mạng lưới. Điều này cho phép hệ thống hiểu được mối tương quan giữa các điểm chính đó và đưa ra quyết định tốt hơn về nhận dạng xe và các đặc điểm phân biệt.
Một tiến bộ quan trọng khác là hợp nhất dữ liệu đa phương thức và hợp nhất tính năng. Thay vì chỉ dựa vào hình ảnh, các hệ thống mới hơn kết hợp thông tin trực quan với các tín hiệu đa phương tiện khác, chẳng hạn như dữ liệu GPS hoặc các mẫu chuyển động từ cảm biến. Bối cảnh bổ sung này giúp hệ thống dễ dàng duy trì độ chính xác khi xe bị chắn một phần, ánh sáng yếu hoặc góc camera thay đổi đột ngột.
Nhận dạng lại phương tiện đang trở thành một phương pháp quan trọng trong hệ thống giao thông thông minh, giúp các thành phố track xe cộ đáng tin cậy hơn trên nhiều camera khác nhau. Nhờ những tiến bộ trong học sâu và xác thực tốt hơn bằng cách sử dụng các tập dữ liệu phong phú và đa dạng hơn, các hệ thống này đang trở nên chính xác và thiết thực hơn trong điều kiện thực tế.
Khi công nghệ phát triển, điều quan trọng là phải cân bằng giữa đổi mới sáng tạo với các hoạt động có trách nhiệm về quyền riêng tư, bảo mật và đạo đức. Nhìn chung, những tiến bộ này đang mở đường cho các mạng lưới giao thông thông minh hơn, an toàn hơn và hiệu quả hơn.
Khám phá thêm về AI bằng cách truy cập kho lưu trữ GitHub và tham gia cộng đồng của chúng tôi. Xem các trang giải pháp của chúng tôi để tìm hiểu về AI trong robot và thị giác máy tính trong sản xuất . Khám phá các tùy chọn cấp phép của chúng tôi để bắt đầu với Vision A ngay hôm nay!