Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Hướng dẫn

Làm thế nào để tính toán khoảng cách bằng các model computer vision?

Tìm hiểu cách tính khoảng cách trong các ứng dụng computer vision sử dụng Ultralytics YOLO11 giúp đo lường sự gần gũi của các đối tượng trong thời gian thực.

ABAbirami Vina
4 min read
Tính toán khoảng cách sử dụng các model computer vision

Khi bạn đang băng qua đường và thấy một chiếc xe lao về phía mình, bạn có thể nhận biết ngay lập tức khoảng cách của nó là bao xa. Sự phán đoán nhanh chóng, gần như theo bản năng này có được là nhờ khả năng hiểu về không gian xung quanh bạn. Dựa trên cảm nhận này, bạn có thể quyết định tăng tốc, dừng lại hoặc tiếp tục đi bộ.

Tương tự, thị giác máy tính là một nhánh của trí tuệ nhân tạo (AI) giúp máy móc có thể phát triển khả năng hiểu môi trường xung quanh bằng cách giải mã dữ liệu hình ảnh. Cũng giống như cách bạn đánh giá khoảng cách của một chiếc xe để đưa ra quyết định nhanh chóng, các model thị giác máy tính có thể phân tích hình ảnh và video, giúp máy móc cảm nhận và phản ứng với thế giới xung quanh chúng.

Ví dụ, Ultralytics YOLO11 là một model thị giác máy tính có khả năng phát hiện và theo dõi các đối tượng trong hình ảnh và video theo thời gian thực. Nói một cách đơn giản, YOLO11 hoạt động bằng cách xem toàn bộ hình ảnh cùng một lúc thay vì từng phần, điều này giúp nó nhanh và hiệu quả hơn. Nó cũng có thể xử lý các tác vụ thị giác máy tính như phân đoạn đối tượng (instance segmentation), ước tính tư thế (pose estimation) và phân loại hình ảnh.

Đặc biệt, các khả năng của YOLO11 có thể được sử dụng để tính toán khoảng cách giữa các đối tượng, điều này rất hữu ích trong nhiều lĩnh vực như sản xuất, bán lẻ và quản lý đám đông, giúp cải thiện sự an toàn và hiệu quả.

Trong bài viết này, chúng ta sẽ khám phá cách sử dụng YOLO11 để tính toán khoảng cách trong các ứng dụng thị giác máy tính, tại sao điều đó quan trọng và tác động của nó trong các ngành công nghiệp khác nhau.

Ví dụ về việc sử dụng YOLO để tính toán khoảng cách hạ cánh của máy bay

Hình 1. Ví dụ về việc sử dụng YOLO để tính toán khoảng cách hạ cánh của máy bay.

Link to this sectionTổng quan về tính toán khoảng cách trong thị giác máy tính#

Tính toán khoảng cách trong thị giác máy tính liên quan đến việc phát hiện, xác định vị trí và đo lường số pixel giữa hai đối tượng trong hình ảnh. Pixel là các đơn vị riêng lẻ tạo nên một hình ảnh kỹ thuật số, mỗi pixel đại diện cho một điểm duy nhất với giá trị màu sắc hoặc cường độ cụ thể.

Để chuyển đổi các phép đo pixel sang khoảng cách thực tế, hiệu chuẩn là yếu tố then chốt. Bạn có thể coi đây giống như việc sử dụng thước kẻ để đo một vật gì đó và sau đó sử dụng phép đo đó để hiểu kích thước của các vật thể khác. Bằng cách tham chiếu các đối tượng có kích thước đã biết, hiệu chuẩn tạo ra mối liên kết giữa pixel và khoảng cách vật lý thực tế.

Hãy xem một ví dụ để thấy cách thức hoạt động của nó. Trong hình ảnh dưới đây, đồng xu là đối tượng tham chiếu và kích thước của nó (0,9 inch x 1,0 inch) đã được biết trước. Bằng cách so sánh các phép đo pixel của các đối tượng khác với kích thước của đồng xu, chúng ta có thể tính toán kích thước thực tế của chúng.

Một đồng xu được dùng làm vật tham chiếu để đo kích thước thực tế của các vật thể khác

Hình 2. Một đồng xu có thể được sử dụng làm tham chiếu để đo kích thước thực tế của các đối tượng khác.

Tuy nhiên, tính toán khoảng cách được thực hiện trên mặt phẳng hai chiều (2D), nghĩa là nó chỉ đo khoảng cách ngang và dọc giữa các đối tượng. Điều này khác với ước tính độ sâu (depth estimation), vốn đo khoảng cách của các đối tượng trong không gian ba chiều, bao gồm cả khoảng cách từ camera.

Mặc dù camera độ sâu có thể đo độ sâu thực và cung cấp thông tin không gian chi tiết hơn, nhưng trong nhiều trường hợp, một khoảng cách đơn giản đã được hiệu chuẩn là đủ. Ví dụ, việc biết khoảng cách giữa các đối tượng trên mặt phẳng 2D hoạt động tốt cho các tác vụ như theo dõi đối tượng hoặc quản lý hàng đợi, vì vậy ước tính độ sâu không cần thiết trong những tình huống đó.

Link to this sectionTìm hiểu cách thức hoạt động của việc tính toán khoảng cách bằng YOLO11#

Tiếp theo, hãy cùng tìm hiểu cách tính khoảng cách giữa hai đối tượng bằng cách sử dụng khả năng hỗ trợ phát hiện đối tượng và theo dõi của YOLO11. Dưới đây là các bước cụ thể:

  • Phát hiện và theo dõi đối tượng: YOLO11 có thể được sử dụng để phát hiện đối tượng bằng cách nhận diện chúng trong một khung hình và theo dõi chuyển động của chúng qua các khung hình trong video. Nó gán một ID theo dõi duy nhất cho từng đối tượng, cho phép hệ thống giám sát vị trí và chuyển động của chúng trong suốt video.
  • Bounding box (khung bao): Các Bounding box được vẽ xung quanh các đối tượng đã phát hiện dựa trên kết quả phát hiện đối tượng của YOLO11, giúp xác định vị trí của chúng trong hình ảnh.
  • Chọn đối tượng: Hai đối tượng có thể được chọn để tập trung theo dõi, và YOLO11 sẽ cập nhật các Bounding box khi các đối tượng di chuyển theo thời gian thực.
  • Tính toán trọng tâm (Centroid): Các trọng tâm (điểm trung tâm của các Bounding box của hai đối tượng) được tính toán dựa trên tọa độ các góc của Bounding box, đại diện cho vị trí của các đối tượng.
  • Tính toán khoảng cách: Trọng tâm của hai đối tượng sau đó có thể được sử dụng để tính khoảng cách Euclid giữa chúng. Khoảng cách Euclid là khoảng cách đường thẳng giữa hai điểm trên mặt phẳng 2D, được tính bằng cách sử dụng sự khác biệt theo cả chiều ngang và chiều dọc. Điều này cung cấp khoảng cách giữa hai đối tượng tính theo pixel.

Điều quan trọng cần lưu ý là các khoảng cách được tính bằng phương pháp này chỉ là ước tính vì chúng dựa trên các phép đo pixel 2D.

Sử dụng Ultralytics YOLO để phát hiện người và tính toán khoảng cách

Hình 3. Sử dụng Ultralytics YOLO để phát hiện người và tính toán khoảng cách.

Link to this sectionTác động của việc ước tính khoảng cách bằng YOLO#

Xét thấy việc tính toán khoảng cách bằng YOLO11 chỉ là ước tính, bạn có thể tự hỏi: Nó có thể được sử dụng ở đâu và tạo ra sự khác biệt như thế nào?

Vì các thông số hiệu chuẩn được sử dụng để đưa ra các ước tính khoảng cách này, chúng đủ chính xác để hỗ trợ trong nhiều tình huống thực tế. Việc ước tính khoảng cách của YOLO11 đặc biệt hữu ích trong các môi trường năng động như nhà kho, nơi các đối tượng liên tục di chuyển và cần có sự điều chỉnh theo thời gian thực để duy trì hoạt động trơn tru.

Một ví dụ thú vị là sử dụng YOLO11 để theo dõi các kiện hàng trên băng chuyền và ước tính khoảng cách giữa chúng theo thời gian thực. Điều này giúp các quản lý kho đảm bảo các kiện hàng được sắp xếp cách đều nhau, ngăn ngừa va chạm và giữ cho mọi thứ vận hành ổn định.

Trong những trường hợp như vậy, khoảng cách chính xác không phải lúc nào cũng cần thiết. Thông thường, một phạm vi hoặc ngưỡng cho khoảng cách tối ưu được thiết lập, vì vậy ước tính là đủ tốt cho các loại ứng dụng này.

Phát hiện các kiện hàng bằng cách sử dụng YOLO11 và tính toán khoảng cách giữa chúng

Hình 4. Phát hiện các kiện hàng bằng YOLO11 và tính toán khoảng cách giữa chúng.

Link to this sectionTính toán khoảng cách trong các ứng dụng thị giác máy tính#

Nhiều ứng dụng thị giác máy tính có thể hưởng lợi từ việc tính toán khoảng cách giữa các đối tượng bằng YOLO11. Ví dụ, trong phân tích bán lẻ, nó giúp cải thiện quản lý hàng đợi bằng cách theo dõi vị trí của khách hàng theo thời gian thực. Điều này giúp doanh nghiệp phân bổ nguồn lực tốt hơn, giảm thời gian chờ đợi và tạo ra trải nghiệm mua sắm mượt mà hơn. Bằng cách điều chỉnh động mức độ nhân sự và quản lý luồng khách hàng, các cửa hàng có thể tránh tình trạng quá tải và tối ưu hóa việc sử dụng không gian.

Tương tự, trong quản lý giao thông, ước tính khoảng cách giúp giám sát mật độ phương tiện và phân tích các mô hình giao thông. Công nghệ này có thể được sử dụng để phát hiện các hành vi nguy hiểm như bám đuôi và điều chỉnh tín hiệu giao thông để duy trì dòng xe lưu thông suôn sẻ. Nó giúp các con đường an toàn hơn bằng cách xác định các vấn đề tiềm ẩn và cải thiện việc quản lý giao thông tổng thể theo thời gian thực.

Tính toán khoảng cách hỗ trợ bởi thị giác máy tính được sử dụng để giám sát lưu lượng giao thông

Hình 5. Tính toán khoảng cách hỗ trợ bởi thị giác máy tính có thể được sử dụng để giám sát giao thông.

Một ứng dụng độc đáo khác của công nghệ này xuất hiện trong đại dịch COVID-19 khi nó giúp thúc đẩy giãn cách xã hội. Nó đảm bảo mọi người giữ khoảng cách an toàn ở các không gian công cộng, cửa hàng và bệnh viện, giảm nguy cơ lây lan virus.

Bằng cách theo dõi khoảng cách theo thời gian thực, các cảnh báo có thể được gửi đi khi các cá nhân ở quá gần nhau, giúp các doanh nghiệp và cơ sở y tế phản ứng nhanh chóng và duy trì môi trường an toàn hơn cho mọi người.

Link to this sectionƯu và nhược điểm của việc tính toán khoảng cách trong thị giác máy tính#

Bây giờ chúng ta đã thảo luận về một số ứng dụng của việc tính toán khoảng cách bằng thị giác máy tính, dưới đây là cái nhìn sâu hơn về những lợi ích liên quan:

  • Tự động hóa: AI thị giác có thể tự động hóa các tác vụ tính toán khoảng cách mà nếu không sẽ cần theo dõi thủ công, giúp giảm sai sót của con người và chi phí nhân công trong khi tăng năng suất.
  • Tối ưu hóa nguồn lực: Bằng cách biết khoảng cách và sự gần gũi của các đối tượng, các nguồn lực (như nhân viên hoặc máy móc) có thể được tối ưu hóa, giảm lãng phí và cải thiện quy trình làm việc.
  • Độ phức tạp thiết lập tối thiểu: Sau khi thiết lập, các hệ thống tính toán khoảng cách sử dụng thị giác máy tính đòi hỏi bảo trì tương đối thấp và cần ít sự can thiệp của con người hơn so với các hệ thống khác dựa vào đầu vào thủ công hoặc máy móc phức tạp.

Bất chấp những ưu điểm này, vẫn có một số hạn chế cần lưu ý khi triển khai các hệ thống như vậy. Dưới đây là cái nhìn nhanh về các yếu tố chính cần xem xét khi tính toán khoảng cách bằng thị giác máy tính:

  • Độ nhạy với các yếu tố môi trường: Độ chính xác của việc tính toán khoảng cách có thể bị ảnh hưởng bởi điều kiện ánh sáng, bóng đổ, phản chiếu hoặc vật cản, dẫn đến các lỗi hoặc sự không nhất quán tiềm ẩn.
  • Mối lo ngại về quyền riêng tư: Sử dụng thị giác máy tính để theo dõi các đối tượng hoặc con người có thể gây ra các vấn đề về quyền riêng tư, đặc biệt là ở những nơi công cộng hoặc các môi trường nhạy cảm nơi dữ liệu cá nhân có thể bị ảnh hưởng.
  • Độ phức tạp trong các tình huống nhiều đối tượng: Trong các môi trường có nhiều đối tượng di chuyển, việc tính toán chính xác khoảng cách giữa nhiều đối tượng cùng một lúc có thể dẫn đến sự nhầm lẫn, đặc biệt nếu chúng ở gần nhau hoặc giao cắt nhau.

Link to this sectionCác điểm chính cần lưu ý#

Tính toán khoảng cách giữa các đối tượng bằng YOLO11 là một giải pháp đáng tin cậy có thể hỗ trợ việc ra quyết định. Nó đặc biệt hữu ích trong các môi trường năng động như nhà kho, bán lẻ và quản lý giao thông, nơi việc theo dõi khoảng cách đối tượng có thể cải thiện hiệu quả và sự an toàn.

YOLO11 giúp tự động hóa các tác vụ vốn thường đòi hỏi nỗ lực thủ công. Mặc dù còn một số thách thức như độ nhạy với các yếu tố môi trường và mối lo ngại về quyền riêng tư, nhưng những lợi ích như tự động hóa, khả năng mở rộng và dễ dàng tích hợp khiến nó trở nên rất hiệu quả. Khi thị giác máy tính tiếp tục cải thiện, đặc biệt là trong các lĩnh vực như tính toán khoảng cách, có khả năng chúng ta sẽ thấy một sự thay đổi thực sự trong cách máy móc tương tác và hiểu môi trường xung quanh chúng.

Hãy tham gia cộng đồng của chúng tôi! Khám phá kho GitHub của chúng tôi để tìm hiểu thêm về thị giác AI. Nếu bạn quan tâm đến việc tận dụng thị giác máy tính, hãy xem các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách thị giác máy tính trong chăm sóc sức khỏe đang cải thiện hiệu quả và xem tác động của AI trong nông nghiệp bằng cách truy cập các trang giải pháp của chúng tôi!

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning