Tìm hiểu vai trò của FPS trong computer vision
Tìm hiểu lý do tại sao FPS trong computer vision lại quan trọng và cách nó ảnh hưởng đến việc phát hiện vật thể thời gian thực, phân tích video và các ứng dụng AI.
Việc xem lại khoảnh khắc thể thao yêu thích ở chế độ quay chậm, nơi mọi chi tiết đều rõ nét, rất khác so với việc xem cảnh quay giám sát thường có cảm giác giật và khó theo dõi. Chi tiết kỹ thuật quan trọng đằng sau những khác biệt này là FPS, hay Frames Per Second (Số khung hình trên giây), đề cập đến số lượng khung hình được hiển thị mỗi giây trong một video. FPS cao hơn mang lại chuyển động mượt mà, sống động như thật, trong khi FPS thấp hơn có thể dẫn đến cảnh quay bị giật và kém chi tiết.
Khái niệm này tác động trực tiếp đến thị giác máy tính, một nhánh của AI cho phép máy móc diễn giải và phân tích dữ liệu hình ảnh tương tự như cách con người thực hiện. Trong thị giác máy tính, FPS cao hơn có nghĩa là các hệ thống có thể thu thập nhiều thông tin hơn mỗi giây, cải thiện độ chính xác của việc phát hiện và theo dõi đối tượng theo thời gian thực.
Trong bài viết này, chúng ta sẽ khám phá các khía cạnh kỹ thuật của FPS và cách nó liên quan đến các ứng dụng thị giác máy tính. Hãy bắt đầu nào!
Link to this sectionFPS có nghĩa là gì trong thị giác máy tính?#
Giả sử bạn đang chơi một trò chơi đua xe: ở mức 60 FPS, mọi khúc cua đều cảm thấy mượt mà và phản hồi tốt, nhưng ở 20 FPS, các điều khiển bị lag, khiến việc né tránh chướng ngại vật trở nên khó khăn hơn. Đơn giản mà nói, bạn có thể coi FPS là số lượng ảnh tĩnh được hiển thị mỗi giây. Nhiều ảnh hơn mỗi giây làm cho chuyển động trông mượt mà và tự nhiên, trong khi ít ảnh hơn có thể làm cho nó trông bị đứt quãng.
Cũng giống như trong chơi game, FPS là một phần quan trọng của các ứng dụng thị giác máy tính. FPS cao hơn giúp bạn có thể theo dõi các đối tượng bằng Vision AI một cách mượt mà, trong khi FPS thấp hơn có thể dẫn đến việc bỏ lỡ các chi tiết.
Ví dụ, trong phân tích thể thao, camera hỗ trợ AI cần FPS cao hơn để có thể theo dõi các đường chuyền nhanh, chuyển động của cầu thủ và quỹ đạo bóng. FPS thấp hơn có thể dẫn đến việc bỏ lỡ điểm tiếp xúc quan trọng giữa chân và bóng hoặc một sự thay đổi hướng đột ngột, ảnh hưởng đến độ chính xác của phân tích.
Tương tự, trong giám sát giao thông, các hệ thống dựa vào FPS cao để phát hiện phương tiện chạy quá tốc độ và chuyển làn đường theo thời gian thực. Việc chọn FPS phù hợp phụ thuộc vào các yêu cầu cụ thể của từng ứng dụng thị giác máy tính, cân bằng giữa hiệu suất, tính hiệu quả và độ rõ nét của hình ảnh.

Hình 1. So sánh các tốc độ khung hình khác nhau.
Link to this sectionCác khía cạnh kỹ thuật của FPS trong thị giác máy tính#
Bây giờ chúng ta đã thảo luận FPS là gì và cách nó được sử dụng trong thị giác máy tính, hãy đi sâu vào các khía cạnh kỹ thuật của nó - bắt đầu với cách tính FPS của một video.
Chia tổng số khung hình cho thời lượng tính bằng giây sẽ cho bạn FPS của một video. Ví dụ, nếu một video có 96 khung hình trong 4 giây, kết quả là 24 FPS - nghĩa là 24 hình ảnh được hiển thị mỗi giây - trong khi 32 khung hình trong 4 giây dẫn đến 8 FPS. Các thư viện Python như OpenCV có thể được sử dụng để trích xuất siêu dữ liệu video, đếm khung hình và tự động tính toán FPS, giúp hợp lý hóa quy trình phân tích video.

Hình 2. 24 FPS so với 8 FPS so với 4 FPS.
Link to this sectionCác yếu tố ảnh hưởng đến FPS của một video#
Tuy nhiên, chỉ tính toán FPS thôi là chưa đủ để đưa ra các quyết định kỹ thuật khi phát triển các giải pháp thị giác máy tính. Điều quan trọng là phải xem xét các yếu tố khác nhau có thể ảnh hưởng đến tốc độ khung hình hiệu dụng, chẳng hạn như khả năng phần cứng, tối ưu hóa phần mềm và điều kiện môi trường.
Dưới đây là cái nhìn chi tiết hơn về các yếu tố đó:
- Khả năng phần cứng: Chất lượng của cảm biến camera và sức mạnh xử lý của thiết bị có thể quyết định bao nhiêu khung hình được ghi lại mỗi giây. Phần cứng tốt hơn thường có nghĩa là hỗ trợ FPS cao hơn và video mượt mà hơn.
- Tối ưu hóa phần mềm: Phần mềm xử lý và mã hóa video hiệu quả giúp trích xuất và phân tích khung hình nhanh chóng. Điều này đảm bảo rằng video được xử lý mà không có sự chậm trễ không cần thiết.
- Điều kiện môi trường: Ánh sáng và chuyển động trong cảnh quay ảnh hưởng đến độ rõ nét của các khung hình được ghi lại. Ánh sáng tốt và chuyển động vừa phải có thể cải thiện FPS, trong khi điều kiện kém có thể yêu cầu FPS cao hơn để duy trì độ rõ nét.
- Nhu cầu lưu trữ: FPS cao hơn ghi lại nhiều khung hình hơn mỗi giây, dẫn đến kích thước tệp lớn hơn. Điều này làm tăng yêu cầu lưu trữ và đòi hỏi xử lý dữ liệu nhanh hơn để đảm bảo phát lại mượt mà.
Link to this sectionKhám phá FPS trong các ứng dụng thị giác máy tính#
Các mô hình AI như Ultralytics YOLO11 hỗ trợ các tác vụ thị giác máy tính theo thời gian thực có thể được sử dụng để phân tích video với tốc độ khung hình cao. Khả năng thời gian thực này rất quan trọng đối với các ứng dụng như lái xe tự động, giám sát và robot, nơi ngay cả những độ trễ nhỏ cũng có thể dẫn đến những lỗi nghiêm trọng.
Hãy cùng điểm qua một số ứng dụng Vision AI trong thế giới thực nơi FPS cao là điều cần thiết để đảm bảo độ chính xác và hiệu suất.
Link to this sectionTốc độ khung hình cao hơn cho các giải pháp giám sát và an ninh#
Các hệ thống giám sát giám sát các khu vực có lưu lượng giao thông cao như đường cao tốc sử dụng FPS cao để ghi lại các chi tiết nhỏ, đảm bảo các phương tiện di chuyển nhanh được ghi lại rõ ràng. Độ rõ nét này là cần thiết cho các hệ thống nhận dạng biển số tự động (ANPR), vốn dựa vào cảnh quay chất lượng tốt để xác định phương tiện một cách chính xác.
Trong các hệ thống như vậy, các mô hình như YOLO11 có thể được sử dụng để phát hiện biển số xe trực tiếp từ nguồn cấp dữ liệu video. Khi một biển số được phát hiện, OCR (Nhận dạng ký tự quang học), chuyển đổi hình ảnh văn bản thành các ký tự máy có thể đọc được, được sử dụng để đọc chi tiết biển số. Quy trình này cho phép xác định phương tiện nhanh chóng và chính xác, tăng cường thực thi giao thông và an ninh tổng thể.

Hình 3. Sử dụng YOLO11 để phát hiện biển số xe.
Link to this sectionHiểu các yêu cầu FPS cho các hệ thống tự động#
Hãy xem xét một chiếc xe tự lái tại biển báo dừng, đang phân tích cẩn thận môi trường xung quanh để quyết định xem nó có thể tiến lên an toàn hay không. Chiếc xe này phải đưa ra các quyết định gần như tức thì, điều này đòi hỏi phải thu thập và xử lý dữ liệu hình ảnh theo thời gian thực.
Nếu phương tiện tự động được trang bị camera có khả năng ghi lại cảnh quay ở FPS cao hơn, nó sẽ nhận được luồng hình ảnh liên tục và chi tiết hơn. Đầu vào hình ảnh nâng cao này cho phép chiếc xe phát hiện nhanh chóng chướng ngại vật, người đi bộ và các phương tiện khác. Nó giúp xe có thể phản ứng kịp thời với bất kỳ thay đổi nào trong môi trường của nó.
Nếu các camera xử lý hình ảnh ở mức FPS thấp hơn, chiếc xe có thể nhận được chế độ xem bị giật và kém chi tiết hơn. Điều này có thể làm chậm thời gian phản hồi, tăng nguy cơ bỏ lỡ thông tin quan trọng và có khả năng ảnh hưởng đến an toàn.
Link to this sectionMối liên hệ giữa FPS và phân tích thể thao#
Việc ghi lại mọi chuyển động với độ chính xác là rất quan trọng trong thể thao, nơi các quyết định trong tích tắc có thể tạo ra sự khác biệt giữa thắng và thua. Công nghệ hỗ trợ FPS cao hơn cho phép chúng ta ghi lại mọi chi tiết nhỏ trong chuyển động, và các huấn luyện viên, nhà phân tích và vận động viên có thể xem lại các pha bóng ở chế độ quay chậm mà không bỏ lỡ một nhịp nào. Nó cũng giúp các trọng tài đưa ra các quyết định chính xác hơn trong các môn thể thao như quần vợt, bóng đá và cricket bằng cách cung cấp một góc nhìn rõ ràng, từng khung hình về hành động.
Ví dụ, một nghiên cứu thú vị về bóng chuyền đã phân tích cách sử dụng FPS cao hơn cải thiện đánh giá hiệu suất. Tăng FPS từ 30 lên 240 đã cải thiện đáng kể độ rõ nét của chuyển động và theo dõi đối tượng. Độ chính xác của phân tích cú đập bóng cũng được cải thiện, giúp các huấn luyện viên hiểu rõ hơn về vị trí tay, điểm tiếp xúc bóng và cơ chế nhảy. Ngoài ra, nghiên cứu còn cho thấy FPS cao hơn làm giảm hiện tượng nhòe chuyển động, giúp việc phân tích các pha giao bóng và phản ứng phòng ngự trở nên dễ dàng hơn.

Hình 4. So sánh FPS thấp và cao đối với độ rõ nét của chuyển động.
Link to this sectionKhi nào việc sử dụng FPS thấp mang lại hiệu quả trong phân tích video#
Không phải tất cả các ứng dụng thị giác máy tính đều yêu cầu ghi lại cảnh quay ở FPS cao hơn. Trong nhiều trường hợp, FPS thấp hơn là đủ để đạt được kết quả chính xác, tùy thuộc vào tác vụ. Dưới đây là một số lĩnh vực chính mà FPS thấp hơn được ưu tiên:
- Xử lý và phân tích sau khi quay ngoại tuyến: Đối với các ứng dụng như giám sát giao thông và phân tích đám đông, việc ghi lại mọi khung hình ở FPS cao không phải lúc nào cũng cần thiết. FPS thấp hơn vẫn có thể cung cấp đủ dữ liệu để phân tích các mô hình chuyển động, chẳng hạn như lưu lượng phương tiện, mật độ người đi bộ và xu hướng ùn tắc. Bằng cách giảm các khung hình dư thừa, phương pháp này giảm thiểu yêu cầu lưu trữ và tải tính toán trong khi vẫn duy trì các phân tích chính xác.
- Giám sát môi trường tua nhanh thời gian (time-lapse): Để theo dõi các thay đổi chậm như sự phát triển của cây trồng, tiến độ xây dựng hoặc sự di chuyển của sông băng, việc ghi lại một khung hình mỗi vài phút hoặc mỗi ngày một lần là đủ, ghi lại hiệu quả các biến đổi dài hạn trong khi vẫn tiết kiệm lưu trữ.
- Môi trường hạn chế tài nguyên: Trong giám sát động vật hoang dã và an ninh từ xa, FPS thấp hơn giúp tiết kiệm thời lượng pin và lưu trữ. Các camera kích hoạt bằng chuyển động hoạt động ở mức 5-10 FPS có thể ghi lại các sự kiện thiết yếu trong thời gian dài, khiến chúng trở nên lý tưởng cho các cài đặt ngoài lưới điện.
Link to this sectionChọn FPS phù hợp cho các ứng dụng học sâu (deep learning)#
Việc chọn FPS lý tưởng đòi hỏi phải cân bằng giữa hiệu suất và các hạn chế của hệ thống. Dưới đây là một số cân nhắc cần lưu ý khi tối ưu hóa FPS cho các ứng dụng học sâu:
- Cân bằng giữa hiệu suất và tài nguyên: FPS cao hơn cải thiện khả năng phản hồi nhưng cũng làm tăng nhu cầu về năng lượng và xử lý. Điều chỉnh FPS linh hoạt, sử dụng nội suy khung hình và tối ưu hóa phần cứng có thể giúp duy trì hiệu suất mượt mà mà không làm quá tải hệ thống.
- Nhu cầu cụ thể của ứng dụng: Các ứng dụng khác nhau có các yêu cầu FPS khác nhau. Các thiết bị chạy bằng pin nên sử dụng FPS thấp hơn để tiết kiệm năng lượng, trong khi các hệ thống thời gian thực như máy bay không người lái và xe tự lái cần FPS cao hơn để phản ứng nhanh và chính xác.
- Thử nghiệm và tối ưu hóa: Các cài đặt FPS nên được thử nghiệm lý tưởng dưới các điều kiện ánh sáng và chuyển động khác nhau. Việc đánh giá độ trễ và so sánh các mức FPS cạnh nhau giúp xác định sự cân bằng tốt nhất giữa khả năng phản hồi, chất lượng hình ảnh và hiệu quả tài nguyên.
Link to this sectionCác đổi mới trong tương lai và tối ưu hóa FPS cho các mô hình AI#
Những tiến bộ trong AI và tối ưu hóa phần cứng đang làm cho tốc độ khung hình cao hơn trở nên dễ đạt được hơn, ngay cả trong các môi trường hạn chế tài nguyên. Ví dụ, các ngành công nghiệp như điện ảnh, thể thao và robot có thể hưởng lợi từ quản lý tốc độ khung hình thông minh hơn, nơi các hệ thống điều chỉnh FPS linh hoạt dựa trên độ phức tạp của chuyển động và sức mạnh xử lý. Nội suy khung hình dựa trên AI cũng cải thiện độ mượt mà của video bằng cách tạo ra các khung hình bổ sung theo thời gian thực.
Trong khi đó, một bước đột phá gần đây từ NVIDIA đang đẩy hiệu suất FPS đi xa hơn nữa. DLSS 4 (Deep Learning Super Sampling) giới thiệu tính năng tạo đa khung hình, sử dụng AI để dự đoán và tạo thêm các khung hình. Điều này tăng tốc độ khung hình lên tới 8 lần trong khi giảm khối lượng công việc cho hệ thống.
Bằng cách để AI xử lý một phần việc kết xuất, DLSS 4 làm cho hình ảnh mượt mà hơn mà không gây thêm căng thẳng cho phần cứng, cải thiện cả hiệu suất và hiệu quả.
Link to this sectionCác điểm chính cần lưu ý#
FPS không chỉ đơn thuần là thước đo hình ảnh mượt mà; nó thúc đẩy việc ra quyết định theo thời gian thực trong AI và thị giác máy tính. Mỗi khung hình trong video ghi lại dữ liệu quan trọng, cho phép máy móc theo dõi đối tượng, phân tích chuyển động và phản ứng với các môi trường động. Cho dù đó là xe tự lái tránh chướng ngại vật hay hệ thống giám sát phát hiện các mối đe dọa ngay lập tức, FPS phù hợp đảm bảo độ chính xác và hiệu quả.
Tương lai của FPS không chỉ là tăng tốc độ khung hình mà còn là tối ưu hóa chúng một cách thông minh. Sự tiến hóa này sẽ làm cho các hệ thống thị giác máy tính nhanh hơn, đổi mới hơn và tiết kiệm tài nguyên hơn trên nhiều ngành công nghiệp.
Bạn muốn tìm hiểu thêm về AI? Hãy khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Bạn đã sẵn sàng bắt đầu các dự án thị giác máy tính của riêng mình chưa? Hãy xem các tùy chọn cấp phép của chúng tôi. Tìm hiểu cách thị giác máy tính trong chăm sóc sức khỏe đang cải thiện hiệu quả và khám phá tác động của AI trong sản xuất bằng cách truy cập các trang giải pháp của chúng tôi!






