Thị giác máy tính giúp theo dõi chuyển động đáng tin cậy hơn
Tìm hiểu cách AI và thị giác máy tính làm cho việc theo dõi chuyển động trở nên thông minh hơn, nhanh hơn và đáng tin cậy hơn trong thể thao, robot, ứng dụng di động và các quy trình thực tế khác.

Khi bạn xem một vở kịch và diễn viên yêu thích di chuyển trên sân khấu, đôi mắt của bạn có thể dõi theo họ mà gần như không cần nỗ lực có ý thức. Đối với con người, loại theo dõi chuyển động này mang lại cảm giác rất tự nhiên. Não bộ của bạn tự động kết nối những gì bạn nhìn thấy từ khoảnh khắc này sang khoảnh khắc tiếp theo, lấp đầy các khoảng trống và duy trì cảm giác liên tục khi cảnh vật thay đổi.
Đối với máy móc, nhiệm vụ tương tự lại phức tạp hơn nhiều. Một camera quay video dưới dạng chuỗi các khung hình riêng biệt và một hệ thống phải liên tục nhận diện cùng một đối tượng từng bước một để ước tính vị trí đối tượng đã di chuyển đến, đồng thời quyết định xem đó có còn là đối tượng cần theo dõi hay không.
Thử thách này chính là cốt lõi của motion tracking. Motion tracking liên quan đến việc truy vết một đối tượng xuyên suốt video theo thời gian và đóng vai trò quan trọng trong các lĩnh vực như phân tích thể thao, robotics và các ứng dụng di động.
Phương pháp theo dõi chuyển động và camera truyền thống thường phụ thuộc vào việc thiết lập thủ công, các track point và keyframe. Nó có thể hoạt động trong các cảnh đơn giản, nhưng sẽ nhanh chóng trở nên chậm chạp và kém tin cậy khi chuyển động diễn ra nhanh hoặc bị che khuất một phần.

Hình 1. Một cái nhìn về hệ thống theo dõi chuyển động (Nguồn)
Những tiến bộ gần đây trong computer vision làm cho việc này trở nên dễ dàng hơn nhiều. Computer vision là một nhánh của AI giúp máy móc hiểu được hình ảnh và video, khiến motion tracking trở nên chính xác hơn và ít phụ thuộc vào công việc thủ công hơn. Bằng cách phát hiện các đối tượng trong mỗi khung hình và giữ cho nhận dạng của chúng nhất quán theo thời gian, các hệ thống này theo dõi chuyển động đáng tin cậy hơn trong các điều kiện thực tế.
Trong bài viết này, chúng ta sẽ khám phá cách computer vision giúp motion tracking trở nên hợp lý hơn. Hãy bắt đầu thôi!
Link to this sectionCác phương pháp motion capture và tracking truyền thống cùng những hạn chế của chúng#
Motion tracking truyền thống thường yêu cầu thiết lập thủ công cẩn thận, đặc biệt là trong các quy trình chỉnh sửa video và VFX, nơi mục tiêu là gắn đồ họa, hiệu ứng hoặc lớp phủ vào các yếu tố đang di chuyển trong cảnh quay.
Nhiều quy trình bắt đầu bằng việc đặt các track point trên các phần cụ thể của cảnh quay, sau đó phần mềm sẽ theo dõi chúng qua các khung hình để lập bản đồ đường đi của chuyển động. Điều này rất phổ biến trong các công cụ như After Effects và các quy trình tương tự xuất hiện trong Premiere Pro thông qua các tính năng như mask tracking, nơi biên tập viên theo dõi một mặt nạ hoặc khu vực theo thời gian.
Match moving là một phương pháp phổ biến khác. Nó giúp căn chỉnh các yếu tố kỹ thuật số với chuyển động camera thực tế để các hiệu ứng hoặc đồ họa giữ nguyên vị trí trong một cảnh quay trực tiếp. Những phương pháp này có thể hoạt động tốt cho các cảnh đơn giản, nhưng chúng thường gặp khó khăn khi cảnh quay trở nên đông đúc hoặc khi các đối tượng di chuyển nhanh.
Tracking cũng có thể bị lỗi khi ánh sáng thay đổi hoặc khi chủ thể bị che khuất một phần, điều này có thể gây ra hiện tượng drift hoặc nhảy vọt đột ngột trong quá trình theo dõi. Điều đó làm chậm quy trình và buộc biên tập viên phải làm lại các phần của cảnh quay. Khi các đối tượng thay đổi hướng nhanh chóng, các motion tracker cũ có thể chật vật để bắt kịp, dẫn đến kết quả không nhất quán và khó tin tưởng hơn.
Link to this sectionCách computer vision biến đổi motion tracking#
Các hệ thống computer vision tiên tiến sử dụng các model AI để theo dõi các đối tượng đang di chuyển trong video. Thay vì dựa vào việc tinh chỉnh thủ công liên tục hoặc tracking từng khung hình mong manh, model sẽ học cách một đối tượng trông như thế nào và cách nó có xu hướng di chuyển. Điều này giúp motion tracking duy trì sự ổn định ngay cả khi cảnh vật trở nên bận rộn, ánh sáng thay đổi hoặc đối tượng biến mất trong chốc lát.
Ví dụ, các model computer vision như Ultralytics YOLO11 và Ultralytics YOLO26 sắp ra mắt hỗ trợ theo dõi đối tượng bằng cách phát hiện đối tượng trong mọi khung hình. Nói một cách đơn giản, chúng xác định cái gì có trong khung hình và nó ở đâu bằng cách xuất ra các bounding box và điểm số tin cậy cho mỗi đối tượng được phát hiện.

Hình 2. Theo dõi xe cộ sử dụng Ultralytics YOLO11 trong một khu vực (Nguồn)
Thú vị là, các model YOLO không thực sự tự mình theo dõi đối tượng theo thời gian. Thay vào đó, việc tracking được kích hoạt thông qua Ultralytics Python package, kết nối các kết quả phát hiện của YOLO với các thuật toán theo dõi đa đối tượng như ByteTrack và BoT-SORT. Trong thiết lập này, YOLO phát hiện các đối tượng theo từng khung hình và tracker liên kết các kết quả phát hiện đó qua các khung hình để duy trì ID nhất quán cho mỗi đối tượng khi nó di chuyển.
Link to this sectionCác ứng dụng thực tế của motion tracking hỗ trợ bởi AI#
Tiếp theo, hãy xem xét kỹ hơn một vài ứng dụng thực tế nơi motion tracking hỗ trợ bởi AI đang tạo ra tác động.
Link to this sectionPhân tích thể thao và theo dõi cầu thủ chính xác#
Trong một trận đấu bóng đá, các cầu thủ liên tục tăng tốc, dừng lại và thay đổi hướng, điều này khiến việc đo lường chuyển động chính xác trên sân trở nên khó khăn. Theo dõi thủ công thường thất bại trong những khoảnh khắc này, đặc biệt là khi các cầu thủ chồng chéo, tụ tập lại hoặc di chuyển qua các khu vực đông đúc.
Motion tracking hỗ trợ bởi AI giúp ích bằng cách theo dõi từng cầu thủ qua các hành động và giữ cho đường di chuyển của họ rõ ràng và nhất quán. Ví dụ, trong một nghiên cứu gần đây, các nhà nghiên cứu đã sử dụng YOLO11 để phát hiện cầu thủ và quả bóng từ nhiều góc quay camera. YOLO11 đã xác định từng cầu thủ trong mọi khung hình, trong khi một hệ thống tracking liên kết các phát hiện đó theo thời gian để giữ cho nhận dạng của mỗi cầu thủ nhất quán khi họ di chuyển.

Hình 3. Phát hiện và theo dõi nhiều cầu thủ bóng đá (Nguồn)
Link to this sectionMotion tracking trong thực tế tăng cường và thực tế ảo#
Augmented reality (AR) là thứ giúp các ứng dụng có thể đặt các đối tượng kỹ thuật số vào thế giới thực, như một nhãn dán trên sản phẩm, một nhân vật trên sàn nhà hoặc lớp phủ trên bàn chân của bạn khi bạn di chuyển. Để những trải nghiệm này trở nên đáng tin cậy, nội dung ảo phải được neo đúng vị trí khi bạn đi bộ xung quanh, nghiêng điện thoại hoặc di chuyển chính đối tượng đó.
Computer vision đóng vai trò quan trọng ở đây vì nó giúp thiết bị di động hiểu được những gì nó đang nhìn và cách camera đang di chuyển qua cảnh quay. Nói cách khác, nó cho phép theo dõi 3D bằng cách ước tính vị trí của một đối tượng trong không gian và cách nó định hướng, sau đó cập nhật vị trí đó khi người dùng di chuyển.

Hình 4. Ví dụ về theo dõi 3D trong một ứng dụng AR (Nguồn)
Thực tế ảo (VR) dựa trên các ý tưởng theo dõi tương tự, nhưng mục tiêu lại khác biệt. Thay vì neo nội dung kỹ thuật số vào thế giới thực, VR tập trung vào việc theo dõi đầu và tay của bạn để thế giới ảo phản hồi một cách tự nhiên khi bạn di chuyển.
Link to this sectionTheo dõi thiết bị di chuyển và tự động hóa quy trình#
Môi trường công nghiệp thường có thiết bị và sản phẩm di chuyển qua nhiều giai đoạn của quy trình làm việc. Mỗi giai đoạn đều phụ thuộc vào thời gian và sự phối hợp chính xác. Theo dõi thủ công có thể bị tụt hậu vì các mặt hàng di chuyển với tốc độ khác nhau, chồng chéo lên nhau hoặc thay đổi vị trí nhanh chóng.
Motion tracking hỗ trợ bởi AI giúp ích bằng cách cung cấp cho các hệ thống sản xuất cái nhìn rõ ràng hơn về từng đối tượng khi nó di chuyển qua dây chuyền. Trong một nghiên cứu thú vị, một mạng lưới các camera được kết nối đã theo dõi sản phẩm xuyên suốt toàn bộ quy trình sản xuất và cập nhật một bản sao kỹ thuật số, một bản sao ảo của quy trình thực, trong thời gian thực.
Hệ thống đã xác định từng sản phẩm, theo dõi chuyển động của nó và giữ cho model kỹ thuật số được căn chỉnh với những gì đang diễn ra trên sàn sản xuất. Phương pháp này đã cải thiện việc giám sát và hỗ trợ vận hành an toàn hơn bằng cách cung cấp cho người vận hành cái nhìn đáng tin cậy ở mọi giai đoạn. Nó cũng cho thấy cách motion tracking có thể cho phép tự động hóa linh hoạt và có khả năng mở rộng hơn khi có dữ liệu theo dõi nhất quán.
Link to this sectionƯu và nhược điểm của motion tracking hỗ trợ bởi AI#
Dưới đây là một vài lợi thế của việc sử dụng motion tracking hỗ trợ bởi AI:
- Cải thiện khả năng phục hồi khi bị che khuất: Các hệ thống vision AI thường có thể duy trì hoặc lấy lại các track khi các đối tượng chồng chéo hoặc biến mất trong chốc lát.
- Khả năng mở rộng: Sau khi được triển khai, các AI tracker có thể xử lý các đoạn video dài và nhiều nguồn cấp dữ liệu camera mà không cần thiết lập thủ công cho từng cảnh quay.
- Dữ liệu chuyển động phong phú hơn: Kết quả tracking có thể được sử dụng để đo lường đường đi, số lượng, thời gian dừng và ước tính tốc độ cơ bản cho mục đích phân tích.
Theo dõi hỗ trợ bởi AI hoạt động tốt trong nhiều trường hợp, nhưng nó không phải là cắm và chạy trong mọi thiết lập. Dưới đây là một số hạn chế cần cân nhắc:
- Bảo trì liên tục: Hiệu suất có thể thay đổi theo thời gian khi góc camera, môi trường hoặc khối lượng công việc thay đổi, vì vậy các bản cập nhật định kỳ thường cần thiết.
- Độ phức tạp của tích hợp: Kết nối các tracker vào các trình chỉnh sửa video, hệ thống phân tích hoặc tự động hóa hiện có có thể yêu cầu bộ điều hợp, hiệu chuẩn và kiểm tra bổ sung.
- Các trường hợp biên trong điều kiện khắc nghiệt: Ánh sáng yếu, nhòe chuyển động, bị che khuất nặng và các đối tượng rất nhỏ vẫn có thể gây ra lỗi tracking.
Link to this sectionCác điểm chính cần lưu ý#
Các tính năng motion tracking do AI điều khiển đang nhanh chóng trở thành lựa chọn thực tế hơn cho video trong thế giới thực, nơi chuyển động nhanh, cảnh quay đông đúc và các bản sửa lỗi thủ công không thể mở rộng. Computer vision đang cải thiện nhanh chóng, và điều đó làm cho các hệ thống tracking dễ triển khai hơn và đáng tin cậy hơn trong các điều kiện đầy thách thức. Kết quả là, motion tracking đang trở nên hữu ích hơn trong robotics, ứng dụng di động, phân tích và sáng tạo nội dung.
Tham gia cộng đồng của chúng tôi và khám phá những tiến bộ mới nhất trong vision AI trên GitHub repository. Truy cập các trang giải pháp của chúng tôi để tìm hiểu cách các ứng dụng như AI in manufacturing và computer vision in healthcare đang thúc đẩy sự tiến bộ, và xem các tùy chọn cấp phép của chúng tôi để tăng cường sức mạnh cho giải pháp AI tiếp theo của bạn.






