Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Tìm hiểu về vai trò của FPS trong thị giác máy tính

Abirami Vina

4 phút đọc

20 tháng 3, 2025

Tìm hiểu lý do tại sao FPS trong thị giác máy tính lại quan trọng và nó ảnh hưởng đến việc phát hiện đối tượng theo thời gian thực, phân tích video và các ứng dụng hỗ trợ AI như thế nào.

Xem lại một đoạn phát lại chuyển động chậm của khoảnh khắc thể thao yêu thích của bạn, nơi mọi chi tiết đều rõ ràng, rất khác so với việc xem cảnh quay giám sát thường trông giật cục và khó theo dõi. Chi tiết kỹ thuật quan trọng đằng sau những khác biệt này là FPS, hay Số khung hình trên giây, đề cập đến số lượng khung hình được hiển thị mỗi giây trong một video. FPS càng cao thì chuyển động càng mượt mà, sống động như thật, trong khi FPS thấp hơn có thể dẫn đến cảnh quay giật cục, ít chi tiết hơn.

Khái niệm này tác động trực tiếp đến thị giác máy tính, một nhánh của AI cho phép máy móc diễn giải và phân tích dữ liệu trực quan tương tự như cách con người làm. Trong thị giác máy tính, FPS cao hơn có nghĩa là các hệ thống có thể thu thập nhiều thông tin hơn mỗi giây, cải thiện độ chính xác của việc phát hiện và theo dõi đối tượng trong thời gian thực.

Trong bài viết này, chúng ta sẽ khám phá các khía cạnh kỹ thuật của FPS và mối liên hệ của nó với các ứng dụng thị giác máy tính. Hãy bắt đầu!

FPS có nghĩa là gì trong computer vision?

Giả sử bạn đang chơi một trò chơi đua xe: ở 60 FPS, mọi lượt rẽ đều mượt mà và phản hồi nhanh, nhưng ở 20 FPS, các điều khiển bị trễ, khiến bạn khó né tránh chướng ngại vật hơn. Nói một cách đơn giản, bạn có thể coi FPS là số lượng ảnh tĩnh được hiển thị mỗi giây. Càng nhiều ảnh mỗi giây thì chuyển động càng mượt mà và tự nhiên, trong khi ít ảnh hơn có thể khiến chuyển động bị giật.

Giống như trong game, FPS là một phần quan trọng của các ứng dụng computer vision. FPS càng cao càng giúp theo dõi các đối tượng bằng Vision AI một cách mượt mà, trong khi FPS thấp hơn có thể dẫn đến việc bỏ lỡ những chi tiết. 

Ví dụ: trong phân tích thể thao, camera hỗ trợ AI cần FPS cao hơn để có thể theo dõi các đường chuyền nhanh, chuyển động của người chơi và quỹ đạo bóng. FPS thấp hơn có thể dẫn đến bỏ lỡ một cú chạm chân vào bóng quan trọng hoặc sự thay đổi hướng nhanh chóng, ảnh hưởng đến độ chính xác của phân tích. 

Tương tự, trong giám sát giao thông, các hệ thống dựa vào FPS cao để phát hiện các phương tiện chạy quá tốc độ và chuyển làn đường trong thời gian thực. Việc chọn FPS phù hợp phụ thuộc vào các yêu cầu cụ thể của từng ứng dụng thị giác máy tính, cân bằng hiệu suất, hiệu quả và độ rõ nét hình ảnh.

__wf_reserved_inherit
Hình 1. So sánh các tốc độ khung hình khác nhau.

Các khía cạnh kỹ thuật của FPS trong thị giác máy tính

Bây giờ chúng ta đã thảo luận về FPS là gì và cách nó được sử dụng trong thị giác máy tính, hãy đi sâu vào các khía cạnh kỹ thuật của nó - bắt đầu với cách tính FPS của video. 

Việc chia tổng số khung hình cho thời lượng tính bằng giây sẽ cho bạn biết FPS của video. Ví dụ: nếu một video có 96 khung hình trong 4 giây, thì sẽ tính được 24 FPS - nghĩa là 24 hình ảnh được hiển thị mỗi giây - trong khi 32 khung hình trong 4 giây sẽ cho ra 8 FPS. Các thư viện Python như OpenCV có thể được sử dụng để trích xuất siêu dữ liệu video, đếm số khung hình và tự động tính toán FPS, giúp đơn giản hóa quy trình phân tích video.

__wf_reserved_inherit
Hình 2. 24 FPS so với 8 FPS so với 4FPS.

Các yếu tố ảnh hưởng đến FPS của video

Tuy nhiên, chỉ tính toán FPS thôi là chưa đủ để đưa ra các quyết định kỹ thuật khi phát triển các giải pháp thị giác máy tính. Điều quan trọng nữa là phải xem xét các yếu tố khác nhau có thể ảnh hưởng đến tốc độ khung hình hiệu quả, chẳng hạn như khả năng phần cứng, tối ưu hóa phần mềm và điều kiện môi trường. 

Sau đây là phân tích chi tiết hơn về các yếu tố đó:

  • Khả năng phần cứng: Chất lượng của cảm biến máy ảnh và sức mạnh xử lý của thiết bị có thể xác định số lượng khung hình được chụp mỗi giây. Phần cứng tốt hơn thường có nghĩa là hỗ trợ FPS cao hơn và video mượt mà hơn.
  • Tối ưu hóa phần mềm: Phần mềm xử lý và mã hóa video hiệu quả giúp trích xuất và phân tích khung hình một cách nhanh chóng. Điều này đảm bảo rằng video được xử lý mà không bị chậm trễ không cần thiết.
  • Điều kiện môi trường: Ánh sáng và chuyển động trong một cảnh ảnh hưởng đến độ rõ nét của khung hình được ghi lại. Ánh sáng tốt và chuyển động vừa phải có thể cải thiện FPS, trong khi điều kiện kém có thể yêu cầu FPS cao hơn để duy trì độ rõ nét.
  • Nhu cầu lưu trữ: FPS càng cao thì số lượng khung hình trên giây được ghi lại càng nhiều, dẫn đến kích thước file lớn hơn. Điều này làm tăng yêu cầu về dung lượng lưu trữ và đòi hỏi quá trình xử lý dữ liệu nhanh hơn để đảm bảo phát lại mượt mà.

Khám phá FPS trong các ứng dụng thị giác máy tính

Các mô hình AI như Ultralytics YOLO11 hỗ trợ các tác vụ thị giác máy tính theo thời gian thực có thể được sử dụng để phân tích video với tốc độ khung hình cao. Khả năng theo thời gian thực này rất quan trọng đối với các ứng dụng như lái xe tự động, giám sát và robot, nơi ngay cả những chậm trễ nhỏ cũng có thể dẫn đến những sai sót đáng kể. 

Hãy cùng xem qua một số ứng dụng Vision AI thực tế, nơi FPS cao là điều cần thiết để đảm bảo độ chính xác và hiệu suất. 

Tốc độ khung hình cao hơn cho các giải pháp giám sát và an ninh

Các hệ thống giám sát theo dõi các khu vực có mật độ giao thông cao như đường cao tốc sử dụng FPS cao để ghi lại các chi tiết nhỏ, đảm bảo các phương tiện di chuyển nhanh được ghi lại rõ ràng. Độ rõ nét này rất cần thiết cho các hệ thống nhận dạng biển số xe tự động (ANPR), vốn dựa vào cảnh quay chất lượng tốt để xác định chính xác các phương tiện.

Trong các hệ thống như vậy, các mô hình như YOLO11 có thể được sử dụng để phát hiện biển số xe trực tiếp từ nguồn cấp dữ liệu video. Sau khi phát hiện biển số, Nhận dạng ký tự quang học (OCR), chuyển đổi hình ảnh văn bản thành các ký tự có thể đọc được bằng máy, được sử dụng để đọc chi tiết biển số. Quá trình này cho phép xác định xe nhanh chóng và chính xác, tăng cường thực thi giao thông và an ninh tổng thể.

__wf_reserved_inherit
Hình 3. Sử dụng YOLO11 để phát hiện biển số xe.

Tìm hiểu các yêu cầu về FPS (khung hình trên giây) cho các hệ thống tự động

Hãy xem xét một chiếc xe tự lái tại một biển báo dừng, cẩn thận phân tích môi trường xung quanh để quyết định xem nó có thể tiến hành an toàn hay không. Chiếc xe này phải đưa ra các quyết định gần như tức thời, đòi hỏi phải thu thập và xử lý dữ liệu trực quan trong thời gian thực. 

Nếu xe tự hành được trang bị camera có thể ghi lại cảnh quay ở FPS cao hơn, nó sẽ nhận được luồng hình ảnh liên tục và chi tiết hơn. Đầu vào hình ảnh nâng cao này cho phép xe nhanh chóng phát hiện các chướng ngại vật, người đi bộ và các phương tiện khác. Nó giúp xe có thể phản ứng kịp thời với bất kỳ thay đổi nào trong môi trường của nó.

Nếu camera xử lý hình ảnh ở FPS thấp hơn, xe có thể nhận được hình ảnh chập chờn, ít chi tiết hơn. Điều này có thể làm chậm thời gian phản hồi của nó, làm tăng nguy cơ bỏ lỡ thông tin quan trọng và có khả năng gây nguy hiểm cho sự an toàn.

Mối liên hệ giữa FPS và phân tích thể thao

Ghi lại mọi chuyển động một cách chính xác là rất quan trọng trong thể thao, nơi các quyết định trong tích tắc có thể tạo ra sự khác biệt giữa thắng và thua. Công nghệ hỗ trợ FPS cao hơn cho phép chúng ta ghi lại mọi chi tiết nhỏ trong chuyển động và huấn luyện viên, nhà phân tích và vận động viên có thể xem lại các pha quay chậm mà không bỏ lỡ nhịp nào. Nó cũng giúp các trọng tài đưa ra các quyết định chính xác hơn trong các môn thể thao như quần vợt, bóng đá và cricket bằng cách cung cấp một cái nhìn rõ ràng, từng khung hình về hành động.

Ví dụ: một nghiên cứu thú vị về bóng chuyền đã phân tích cách sử dụng FPS cao hơn cải thiện việc đánh giá hiệu suất. Việc tăng FPS từ 30 lên 240 đã cải thiện đáng kể độ rõ nét của chuyển động và khả năng theo dõi đối tượng. Độ chính xác của phân tích cú đánh cũng được cải thiện, giúp huấn luyện viên hiểu rõ hơn về vị trí tay, điểm tiếp xúc bóng và cơ chế bật nhảy. Hơn nữa, nghiên cứu cho thấy FPS cao hơn làm giảm hiện tượng mờ chuyển động, giúp việc phân tích các pha giao bóng và phản ứng phòng thủ trở nên dễ dàng hơn. 

__wf_reserved_inherit
Hình 4. So sánh FPS thấp và cao về độ rõ nét của chuyển động.

Khi sử dụng FPS thấp có hiệu quả trong phân tích video

Không phải tất cả các ứng dụng thị giác máy tính đều yêu cầu quay phim ở FPS cao hơn. Trong nhiều trường hợp, FPS thấp hơn là đủ để đạt được kết quả chính xác, tùy thuộc vào tác vụ. Dưới đây là một số lĩnh vực chính mà FPS thấp hơn được ưu tiên:

  • Phân tích và xử lý ngoại tuyến: Đối với các ứng dụng như giám sát giao thông và phân tích đám đông, việc ghi lại mọi khung hình ở FPS cao không phải lúc nào cũng cần thiết. FPS thấp hơn vẫn có thể cung cấp đủ dữ liệu để phân tích các kiểu di chuyển, chẳng hạn như lưu lượng xe, mật độ người đi bộ và xu hướng tắc nghẽn. Bằng cách giảm các khung hình dư thừa, phương pháp này giảm thiểu yêu cầu về dung lượng lưu trữ và tải tính toán trong khi vẫn duy trì phân tích chính xác.
  • Giám sát môi trường bằng phương pháp tua nhanh thời gian (Time-lapse environmental monitoring): Để theo dõi những thay đổi chậm như sự phát triển của thực vật, tiến độ xây dựng hoặc sự di chuyển của sông băng, việc chụp một khung hình sau mỗi vài phút hoặc mỗi ngày một lần là đủ, ghi lại hiệu quả những biến đổi dài hạn đồng thời tiết kiệm dung lượng lưu trữ.
  • Môi trường bị hạn chế về tài nguyên: Trong giám sát động vật hoang dã và an ninh từ xa, FPS thấp hơn giúp tiết kiệm pin và dung lượng lưu trữ. Các camera kích hoạt bằng chuyển động hoạt động ở tốc độ 5–10 FPS có thể ghi lại các sự kiện thiết yếu trong thời gian dài, khiến chúng trở nên lý tưởng cho các cài đặt ngoài lưới điện.

Chọn FPS phù hợp cho các ứng dụng deep learning

Chọn FPS lý tưởng đòi hỏi sự cân bằng giữa hiệu suất và giới hạn của hệ thống. Dưới đây là một số cân nhắc cần ghi nhớ khi tối ưu hóa FPS cho các ứng dụng deep-learning:

  • Cân bằng hiệu suất và tài nguyên: FPS cao hơn cải thiện khả năng phản hồi nhưng cũng làm tăng nhu cầu về năng lượng và xử lý. Điều chỉnh FPS động, sử dụng nội suy khung hình và tối ưu hóa phần cứng có thể giúp duy trì hiệu suất mượt mà mà không làm quá tải hệ thống.
  • Nhu cầu cụ thể của ứng dụng: Các ứng dụng khác nhau có các yêu cầu FPS khác nhau. Các thiết bị chạy bằng pin nên sử dụng FPS thấp hơn để tiết kiệm năng lượng, trong khi các hệ thống thời gian thực như máy bay không người lái và xe tự hành cần FPS cao hơn để có phản hồi nhanh chóng và chính xác.
  • Kiểm tra và tối ưu hóa: Cài đặt FPS lý tưởng nhất nên được kiểm tra trong các điều kiện ánh sáng và chuyển động khác nhau. Đánh giá độ trễ và so sánh mức FPS cạnh nhau giúp xác định sự cân bằng tốt nhất giữa khả năng phản hồi, chất lượng hình ảnh và hiệu quả tài nguyên.

Đổi mới trong tương lai và tối ưu hóa FPS cho các mô hình AI

Những tiến bộ trong AI và tối ưu hóa phần cứng đang giúp đạt được tốc độ khung hình cao hơn, ngay cả trong môi trường hạn chế tài nguyên. Ví dụ: các ngành như điện ảnh, thể thao và robot có thể hưởng lợi từ việc quản lý tốc độ khung hình thông minh hơn, trong đó các hệ thống điều chỉnh FPS một cách linh hoạt dựa trên độ phức tạp của chuyển động và sức mạnh xử lý. Nội suy khung hình do AI điều khiển cũng cải thiện độ mượt của video bằng cách tạo thêm các khung hình trong thời gian thực.

Trong khi đó, một đột phá gần đây từ NVIDIA đang đẩy hiệu suất FPS lên cao hơn nữa. DLSS 4 (Deep Learning Super Sampling) giới thiệu tính năng tạo đa khung hình, sử dụng AI để dự đoán và tạo thêm khung hình. Điều này giúp tăng tốc độ khung hình lên đến 8 lần đồng thời giảm tải cho hệ thống.

Bằng cách để AI xử lý một phần quá trình dựng hình (rendering), DLSS 4 giúp hình ảnh mượt mà hơn mà không gây thêm áp lực lên phần cứng, cải thiện cả hiệu suất và hiệu quả.

Những điều cần nhớ

FPS không chỉ là thước đo hình ảnh mượt mà; nó thúc đẩy việc ra quyết định theo thời gian thực trong AI và thị giác máy tính. Mỗi khung hình trong video ghi lại dữ liệu quan trọng, cho phép máy móc theo dõi các đối tượng, phân tích chuyển động và phản ứng với môi trường động. Cho dù đó là xe tự lái tránh chướng ngại vật hay hệ thống giám sát phát hiện các mối đe dọa ngay lập tức, FPS phù hợp đảm bảo độ chính xác và hiệu quả.

Tương lai của FPS không chỉ là tăng tốc độ khung hình mà còn là tối ưu hóa chúng một cách thông minh. Sự phát triển này sẽ làm cho các hệ thống thị giác máy tính nhanh hơn, sáng tạo hơn và tiết kiệm tài nguyên hơn trong nhiều ngành công nghiệp khác nhau.

Bạn muốn tìm hiểu thêm về AI? Khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Bạn đã sẵn sàng bắt đầu các dự án computer vision của riêng mình chưa? Hãy xem các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách computer vision trong lĩnh vực chăm sóc sức khỏe đang cải thiện hiệu quả và khám phá tác động của AI trong sản xuất bằng cách truy cập các trang giải pháp của chúng tôi!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard