Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Hãy tìm hiểu cách trí tuệ nhân tạo (AI) và thị giác máy tính giúp theo dõi chuyển động thông minh hơn, nhanh hơn và đáng tin cậy hơn trong thể thao, robot, ứng dụng di động và các quy trình làm việc thực tế khác.
Khi bạn xem một vở kịch và diễn viên yêu thích của bạn di chuyển trên sân khấu, mắt bạn có thể dõi theo họ mà không cần nhiều nỗ lực có ý thức. Đối với con người, kiểu theo dõi chuyển động này diễn ra rất tự nhiên. Não bộ của bạn tự động kết nối những gì bạn nhìn thấy từ khoảnh khắc này sang khoảnh khắc khác, lấp đầy những khoảng trống và duy trì cảm giác liền mạch khi cảnh diễn thay đổi.
Đối với máy móc, nhiệm vụ này phức tạp hơn nhiều. Máy quay phim ghi lại video dưới dạng một chuỗi các khung hình riêng lẻ, và hệ thống phải liên tục xác định cùng một đối tượng từng bước một để ước tính vị trí di chuyển của nó và quyết định xem đó có còn là đối tượng cần theo dõi hay không.
Thách thức này nằm ở cốt lõi của việc theo dõi chuyển động . Theo dõi chuyển động bao gồm việc theo dõi một đối tượng trong video theo thời gian, và nó đóng vai trò quan trọng trong các lĩnh vực như phân tích thể thao, robot và ứng dụng di động.
Các phương pháp theo dõi chuyển động và camera truyền thống thường phụ thuộc vào thiết lập thủ công. track các điểm và khung hình chính. Nó có thể hoạt động trong các cảnh đơn giản, nhưng nhanh chóng trở nên chậm và không đáng tin cậy khi chuyển động nhanh hoặc bị chặn một phần.
Hình 1. Hình ảnh hệ thống theo dõi chuyển động ( Nguồn )
Những tiến bộ gần đây trong lĩnh vực thị giác máy tính đã giúp việc này trở nên dễ dàng hơn nhiều. Thị giác máy tính là một nhánh của trí tuệ nhân tạo giúp máy móc hiểu hình ảnh và video, làm cho việc theo dõi chuyển động chính xác hơn và ít phụ thuộc vào thao tác thủ công. Bằng cách phát hiện các đối tượng trong mỗi khung hình và duy trì tính nhất quán của chúng theo thời gian, các hệ thống này, track Chuyển động đáng tin cậy hơn trong điều kiện thực tế.
Trong bài viết này, chúng ta sẽ cùng tìm hiểu cách thị giác máy tính có thể giúp việc theo dõi chuyển động trở nên hiệu quả hơn. Bắt đầu nào!
Các phương pháp ghi hình và theo dõi chuyển động truyền thống và những hạn chế của chúng
Công nghệ theo dõi chuyển động truyền thống thường yêu cầu thiết lập thủ công cẩn thận, đặc biệt là trong quy trình chỉnh sửa video và hiệu ứng hình ảnh (VFX), nơi mục tiêu là gắn đồ họa, hiệu ứng hoặc lớp phủ vào các yếu tố chuyển động trong cảnh quay.
Nhiều quy trình làm việc bắt đầu bằng việc đặt track Các điểm được chỉ định trên các phần cụ thể của một cảnh quay, sau đó phần mềm sẽ theo dõi chúng qua các khung hình để lập bản đồ đường đi của chuyển động. Điều này phổ biến trong các công cụ như After Effects, và các quy trình làm việc tương tự xuất hiện trong Premiere Pro thông qua các tính năng như theo dõi mặt nạ, nơi các biên tập viên... track một chiếc mặt nạ hoặc một khu vực theo thời gian.
Match moving là một phương pháp phổ biến khác. Nó giúp căn chỉnh các yếu tố kỹ thuật số với chuyển động thực của máy quay để hiệu ứng hoặc đồ họa giữ nguyên vị trí trong cảnh quay trực tiếp. Những phương pháp này có thể hoạt động tốt đối với các cảnh đơn giản, nhưng thường gặp khó khăn khi cảnh quay trở nên phức tạp hoặc khi các đối tượng di chuyển nhanh.
Việc theo dõi cũng có thể gặp trục trặc khi ánh sáng thay đổi hoặc khi đối tượng bị che khuất một phần, điều này có thể gây ra hiện tượng trôi lệch hoặc nhảy đột ngột trong chuyển động. track Điều đó làm chậm quy trình làm việc và buộc người biên tập phải làm lại một số phần của cảnh quay. Khi các vật thể thay đổi hướng nhanh chóng, các thiết bị theo dõi chuyển động cũ có thể khó bắt kịp, dẫn đến kết quả không nhất quán và khó tin cậy hơn.
Công nghệ thị giác máy tính làm thay đổi quá trình theo dõi chuyển động như thế nào?
Các hệ thống thị giác máy tính tiên tiến sử dụng mô hình AI để theo dõi các vật thể chuyển động trong video. Thay vì dựa vào các điều chỉnh thủ công liên tục hoặc theo dõi từng khung hình không ổn định, mô hình sẽ học cách vật thể trông như thế nào và xu hướng chuyển động của nó ra sao. Điều này giúp việc theo dõi chuyển động duy trì ổn định ngay cả khi cảnh quay trở nên phức tạp, ánh sáng thay đổi hoặc vật thể biến mất trong giây lát.
Ví dụ, các mô hình thị giác máy tính như Ultralytics YOLO11 và Ultralytics YOLO26 sắp ra mắt hỗ trợ theo dõi đối tượng bằng cách phát hiện đối tượng trong mỗi khung hình. Nói một cách đơn giản, chúng xác định những gì có trong khung hình và vị trí của nó bằng cách xuất ra các hộp giới hạn và điểm tin cậy cho mỗi đối tượng được phát hiện.
Hình 2. Theo dõi phương tiện bằng cách sử dụng Ultralytics YOLO11 trong một khu vực ( Nguồn )
Điều thú vị là, YOLO các mô hình thực tế không track các đối tượng tự theo dõi theo thời gian. Thay vào đó, việc theo dõi được thực hiện thông qua gói Python Ultralytics , gói này kết nối các đối tượng. YOLO Phát hiện đối tượng bằng các thuật toán theo dõi đa đối tượng như ByteTrack và BoT-SORT. Trong thiết lập này, YOLO Nó phát hiện các đối tượng từng khung hình một, và trình theo dõi liên kết các phát hiện đó giữa các khung hình để duy trì ID nhất quán cho mỗi đối tượng khi nó di chuyển.
Ứng dụng thực tế của công nghệ theo dõi chuyển động dựa trên trí tuệ nhân tạo
Tiếp theo, chúng ta hãy cùng xem xét kỹ hơn một vài ứng dụng thực tế mà công nghệ theo dõi chuyển động dựa trên trí tuệ nhân tạo đang tạo ra tác động.
Phân tích thể thao và theo dõi cầu thủ chính xác
Trong một trận bóng đá , các cầu thủ liên tục tăng tốc, dừng lại và đổi hướng, điều này khiến việc đo lường chuyển động chính xác trên toàn sân trở nên khó khăn. Phương pháp theo dõi thủ công thường gặp trục trặc trong những khoảnh khắc này, đặc biệt là khi các cầu thủ chồng chéo vị trí, tụ lại gần nhau hoặc di chuyển qua những khu vực đông đúc.
Công nghệ theo dõi chuyển động dựa trên trí tuệ nhân tạo giúp theo dõi từng cầu thủ trong suốt quá trình thi đấu và giữ cho đường đi của họ luôn rõ ràng và nhất quán. Ví dụ, trong một nghiên cứu gần đây, các nhà nghiên cứu đã sử dụng YOLO11 để detect cầu thủ và quả bóng từ nhiều góc độ camera khác nhau. YOLO11 Mỗi người chơi được xác định trong từng khung hình, trong khi hệ thống theo dõi liên kết các phát hiện đó theo thời gian để giữ cho danh tính của mỗi người chơi luôn nhất quán khi họ di chuyển.
Hình 3. Phát hiện và theo dõi nhiều cầu thủ bóng đá ( Nguồn )
Theo dõi chuyển động trong thực tế tăng cường và thực tế ảo
Thực tế tăng cường (AR) cho phép các ứng dụng đặt các đối tượng kỹ thuật số vào thế giới thực, chẳng hạn như nhãn trên sản phẩm, nhân vật trên sàn nhà hoặc lớp phủ trên bàn chân khi bạn di chuyển. Để những trải nghiệm này trở nên chân thực, nội dung ảo phải được giữ cố định ở đúng vị trí khi bạn đi lại, nghiêng điện thoại hoặc di chuyển chính đối tượng đó.
Thị giác máy tính đóng vai trò quan trọng ở đây vì nó giúp thiết bị di động hiểu được những gì nó đang nhìn và cách camera di chuyển trong khung cảnh. Nói cách khác, nó cho phép theo dõi 3D bằng cách ước tính vị trí của một vật thể trong không gian và hướng của nó, sau đó cập nhật vị trí đó khi người dùng di chuyển.
Hình 4. Một ví dụ về theo dõi 3D trong ứng dụng AR ( Nguồn )
Thực tế ảo (VR) dựa trên những ý tưởng theo dõi tương tự, nhưng mục tiêu thì khác. Thay vì neo nội dung kỹ thuật số vào thế giới thực, VR tập trung vào việc theo dõi chuyển động đầu và tay của bạn để thế giới ảo phản hồi một cách tự nhiên khi bạn di chuyển.
Theo dõi thiết bị di động và tự động hóa quy trình
Môi trường công nghiệp thường có thiết bị và sản phẩm di chuyển qua nhiều giai đoạn của quy trình làm việc. Mỗi giai đoạn đều phụ thuộc vào thời gian và sự phối hợp chính xác. Việc theo dõi thủ công có thể bị chậm trễ vì các vật phẩm di chuyển với tốc độ khác nhau, chồng chéo lên nhau hoặc thay đổi vị trí nhanh chóng.
Công nghệ theo dõi chuyển động dựa trên trí tuệ nhân tạo giúp hệ thống sản xuất có cái nhìn rõ ràng hơn về từng vật thể khi nó di chuyển dọc theo dây chuyền. Trong một nghiên cứu thú vị, một mạng lưới camera được kết nối đã theo dõi sản phẩm trong toàn bộ chu kỳ sản xuất và cập nhật bản sao kỹ thuật số, một bản sao ảo của quy trình thực, theo thời gian thực.
Hệ thống đã nhận diện từng sản phẩm, theo dõi chuyển động của chúng và giữ cho mô hình kỹ thuật số luôn khớp với những gì đang diễn ra trên sàn sản xuất. Cách tiếp cận này đã cải thiện việc giám sát và hỗ trợ vận hành an toàn hơn bằng cách cung cấp cho người vận hành cái nhìn đáng tin cậy ở mọi giai đoạn. Nó cũng cho thấy cách theo dõi chuyển động có thể cho phép tự động hóa linh hoạt và có khả năng mở rộng hơn khi có dữ liệu theo dõi nhất quán.
Ưu điểm và nhược điểm của công nghệ theo dõi chuyển động dựa trên trí tuệ nhân tạo
Dưới đây là một vài ưu điểm của việc sử dụng công nghệ theo dõi chuyển động dựa trên trí tuệ nhân tạo:
Khả năng phục hồi khi bị che khuất được cải thiện: Hệ thống AI thị giác thường có thể duy trì hoặc khôi phục lại dấu vết khi các vật thể chồng lên nhau hoặc biến mất trong giây lát.
Khả năng mở rộng: Sau khi triển khai, các công cụ theo dõi AI có thể xử lý các đoạn video dài và nhiều nguồn cấp dữ liệu camera mà không cần thiết lập lại cho từng cảnh quay.
Dữ liệu chuyển động phong phú hơn: Dữ liệu theo dõi có thể được sử dụng để đo đường đi, số lượng, thời gian dừng và ước tính tốc độ cơ bản cho mục đích phân tích.
Tính năng theo dõi dựa trên trí tuệ nhân tạo hoạt động tốt trong nhiều trường hợp, nhưng nó không phải là giải pháp "cắm là chạy" trong mọi thiết lập. Dưới đây là một số hạn chế cần xem xét:
Bảo trì thường xuyên: Hiệu năng có thể thay đổi theo thời gian khi góc máy quay, môi trường hoặc khối lượng công việc thay đổi, vì vậy việc cập nhật định kỳ thường là cần thiết.
Độ phức tạp khi tích hợp: Việc kết nối các thiết bị theo dõi vào các trình chỉnh sửa video, hệ thống phân tích hoặc tự động hóa hiện có có thể yêu cầu bộ chuyển đổi, hiệu chỉnh và thử nghiệm bổ sung.
Các trường hợp ngoại lệ trong điều kiện khắc nghiệt: Ánh sáng yếu, hiện tượng nhòe do chuyển động, vật cản lớn và các vật thể rất nhỏ vẫn có thể gây ra lỗi theo dõi.
Những điều cần nhớ
Các tính năng theo dõi chuyển động dựa trên trí tuệ nhân tạo đang nhanh chóng trở thành lựa chọn thiết thực hơn cho video thực tế, nơi chuyển động nhanh, cảnh quay đông đúc và việc điều chỉnh thủ công không khả thi. Thị giác máy tính đang được cải thiện nhanh chóng, giúp các hệ thống theo dõi dễ triển khai hơn và đáng tin cậy hơn trong điều kiện khó khăn. Kết quả là, theo dõi chuyển động đang trở nên hữu ích hơn trong lĩnh vực robot, ứng dụng di động, phân tích và tạo nội dung.