Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Thị giác AI

Camera thị giác máy tính và các ứng dụng của chúng

Từ camera RGB đến cảm biến LiDAR, hãy khám phá cách các loại camera thị giác máy tính khác nhau được sử dụng trong các ứng dụng đa dạng trên khắp các ngành công nghiệp.

ABAbirami Vina
4 min read
Tổng quan về cách thức hoạt động của camera RGB trong thị giác máy tính

Nhiều yếu tố kỹ thuật, chẳng hạn như dữ liệu, thuật toánnăng lực tính toán, đều đóng góp vào sự thành công của một ứng dụng trí tuệ nhân tạo (AI). Cụ thể trong lĩnh vực thị giác máy tính, một phân ngành của AI tập trung vào việc cho phép máy móc phân tích và hiểu hình ảnh cùng video, một trong những yếu tố quan trọng nhất chính là đầu vào hoặc nguồn dữ liệu: camera. Chất lượng và loại camera được sử dụng cho một ứng dụng thị giác máy tính ảnh hưởng trực tiếp đến hiệu suất của các mô hình AI.

Việc lựa chọn đúng camera là rất quan trọng vì các tác vụ thị giác máy tính khác nhau yêu cầu các loại dữ liệu hình ảnh khác nhau. Ví dụ, camera độ phân giải cao được sử dụng cho các ứng dụng như nhận diện khuôn mặt, nơi các chi tiết nhỏ trên khuôn mặt phải được ghi lại với độ chính xác cao. Ngược lại, camera độ phân giải thấp hơn có thể được sử dụng cho các tác vụ như giám sát hàng đợi vốn phụ thuộc vào các mô hình tổng quát hơn là các chi tiết phức tạp.

Ngày nay, có rất nhiều loại camera sẵn có, mỗi loại được thiết kế để đáp ứng các nhu cầu cụ thể. Hiểu được sự khác biệt giữa chúng có thể giúp bạn tối ưu hóa các đổi mới về thị giác máy tính của mình. Hãy cùng khám phá các loại camera thị giác máy tính khác nhau và ứng dụng của chúng trong các ngành công nghiệp.

Link to this sectionKhám phá camera RGB cho thị giác máy tính#

Camera RGB (đỏ, xanh lá cây và xanh dương) thường được sử dụng trong các ứng dụng thị giác máy tính. Chúng ghi lại hình ảnh trong phổ nhìn thấy được với các bước sóng từ 400 đến 700 nanomet (nm). Vì những hình ảnh này tương tự như cách con người nhìn, camera RGB được sử dụng cho nhiều tác vụ như phát hiện đối tượng, phân đoạn cá thểước tính tư thế trong những tình huống mà thị giác giống như con người là đủ.

Tổng quan về cách thức hoạt động của camera RGB

Hình 1. Tổng quan về cách hoạt động của camera RGB.

Các tác vụ này thường liên quan đến việc nhận diện và phát hiện đối tượng từ một góc nhìn hai chiều (2D), nơi việc ghi lại chiều sâu là không cần thiết để có kết quả chính xác. Tuy nhiên, khi một ứng dụng yêu cầu thông tin về chiều sâu, như trong phát hiện đối tượng 3D hoặc robot học, camera RGB-D (Đỏ, Xanh lá cây, Xanh dương và Chiều sâu) sẽ được sử dụng. Các camera này kết hợp dữ liệu RGB với các cảm biến chiều sâu để ghi lại các chi tiết 3D và cung cấp các phép đo chiều sâu theo thời gian thực.

Link to this sectionSử dụng camera RGB-D trong cửa hàng bán lẻ#

Một ứng dụng thú vị mà camera RGB-D có thể hỗ trợ là virtual try-ons, một khái niệm đang trở nên phổ biến tại các retail stores. Nói một cách đơn giản, các màn hình thông minh tích hợp camera RGB-D và cảm biến có thể thu thập các chi tiết như chiều cao, hình dáng cơ thể và chiều rộng vai của người mua hàng. Sử dụng thông tin này, hệ thống có thể phủ kỹ thuật số quần áo lên hình ảnh trực tiếp của khách hàng. Các Computer vision tasks, như instance segmentationpose estimation, có thể xử lý visual data để phát hiện chính xác cơ thể của khách hàng và căn chỉnh quần áo cho phù hợp với tỷ lệ của họ trong thời gian thực.

Khách hàng đang sử dụng hệ thống thử đồ ảo

Hình 2. Một ví dụ về thử đồ ảo.

Thử đồ ảo cung cấp cho khách hàng cái nhìn 3D về cách bộ trang phục sẽ mặc lên người, và một số hệ thống thậm chí có thể mô phỏng cách vải di chuyển để có trải nghiệm thực tế hơn. Thị giác máy tính và camera RGB-D giúp khách hàng có thể bỏ qua phòng thử đồ và thử quần áo ngay lập tức. Nó tiết kiệm thời gian, giúp việc so sánh các kiểu dáng và kích cỡ dễ dàng hơn, đồng thời cải thiện trải nghiệm mua sắm tổng thể.

Link to this sectionTìm hiểu về hình ảnh lập thể và camera đo thời gian bay (ToF)#

Camera lập thể (stereo cameras) là một loại camera sử dụng nhiều cảm biến hình ảnh để ghi lại chiều sâu bằng cách so sánh hình ảnh từ các góc độ khác nhau. Chúng chính xác hơn các hệ thống đơn cảm biến. Trong khi đó, camera hoặc cảm biến Đo thời gian bay (Time-of-Flight - ToF) đo khoảng cách bằng cách phát ra tia hồng ngoại phản xạ từ các vật thể và quay trở lại cảm biến. Thời gian ánh sáng quay trở lại được bộ xử lý của camera tính toán để xác định khoảng cách.

Tổng quan về cách thức hoạt động của camera Time-of-Flight

Hình 3. Tổng quan về cách hoạt động của camera ToF.

Trong một số trường hợp, camera lập thể được tích hợp với cảm biến ToF, kết hợp thế mạnh của cả hai thiết bị để ghi lại thông tin chiều sâu một cách nhanh chóng và có độ chính xác cao. Sự kết hợp giữa các phép đo khoảng cách thời gian thực của cảm biến ToF với khả năng nhận thức chiều sâu chi tiết của camera lập thể làm cho nó trở nên lý tưởng cho các ứng dụng như xe tự láithiết bị điện tử tiêu dùng, nơi tốc độ và độ chính xác đều rất quan trọng.

Link to this sectionMột ví dụ thường ngày về cảm biến chiều sâu bằng camera thời gian bay (ToF)#

Có khả năng là bạn đã từng sử dụng camera Thời gian bay (ToF) mà không hề hay biết. Trên thực tế, các điện thoại thông minh phổ biến từ các thương hiệu như Samsung, Huawei và Realme thường tích hợp cảm biến ToF để tăng cường khả năng cảm biến chiều sâu. Thông tin chiều sâu chính xác mà các camera này cung cấp được sử dụng để tạo ra hiệu ứng bokeh phổ biến, nơi hậu cảnh bị làm mờ trong khi chủ thể vẫn được lấy nét sắc nét.

Cảm biến ToF cũng đang trở nên thiết yếu cho các ứng dụng khác ngoài nhiếp ảnh, chẳng hạn như nhận diện cử chỉthực tế tăng cường (AR). Ví dụ, các điện thoại như Samsung Galaxy S20 Ultra và Huawei P30 Pro sử dụng các cảm biến này để lập bản đồ chiều sâu 3D trong thời gian thực, cải thiện cả nhiếp ảnhtrải nghiệm tương tác.

Link to this sectionCamera hồng ngoại hoặc camera nhiệt để phát hiện nhiệt#

Camera nhiệt, đúng như tên gọi, được sử dụng rộng rãi để phát hiện nhiệt trong nhiều ứng dụng khác nhau, bao gồm ngành sản xuấtnhà máy ô tô. Các camera này đo nhiệt độ và có thể được sử dụng để cảnh báo người dùng khi phát hiện mức nhiệt quan trọng, quá cao hoặc quá thấp. Bằng cách phát hiện bức xạ hồng ngoại vốn vô hình đối với mắt người, chúng cung cấp các chỉ số nhiệt độ chính xác. Thường được gọi là camera hồng ngoại, công dụng của chúng còn mở rộng ra ngoài môi trường công nghiệp. Ví dụ, camera nhiệt cũng được sử dụng trong nông nghiệp để giám sát sức khỏe vật nuôi, trong thanh tra tòa nhà để xác định rò rỉ nhiệt, và trong chữa cháy để xác định các điểm nóng.

Lính cứu hỏa sử dụng camera nhiệt để xác định các điểm nóng

Hình 4. Lính cứu hỏa sử dụng camera nhiệt để tìm điểm nóng.

Link to this sectionẢnh nhiệt cho các ứng dụng công nghiệp#

Máy móc và hệ thống điện tại các nhà máy sản xuất hoặc giàn khoan dầu khí thường hoạt động liên tục và sinh nhiệt như một phụ phẩm. Theo thời gian, nhiệt lượng dư thừa có thể tích tụ trong các thành phần như động cơ, vòng bi, hoặc mạch điện, có khả năng dẫn đến hỏng hóc thiết bị hoặc nguy cơ mất an toàn.

Camera nhiệt có thể giúp người vận hành giám sát các hệ thống này bằng cách phát hiện sớm các mức tăng nhiệt độ bất thường. Một động cơ quá nhiệt có thể được lên lịch bảo trì để tránh hỏng hóc tốn kém. Bằng cách tích hợp ảnh nhiệt vào các đợt kiểm tra định kỳ, các ngành công nghiệp có thể triển khai bảo trì dự đoán, giảm thời gian ngừng hoạt động, kéo dài tuổi thọ thiết bị và đảm bảo môi trường làm việc an toàn hơn. Nhìn chung, hiệu suất nhà máy có thể được cải thiện và rủi ro xảy ra các hỏng hóc bất ngờ có thể được giảm thiểu.

Link to this sectionCamera quay chậm và tốc độ cao để ghi hình chuyển động#

Camera tốc độ cao được thiết kế để chụp hơn 10.000 khung hình mỗi giây (FPS) để có thể xử lý các chuyển động nhanh với độ chính xác vượt trội. Ví dụ, khi các sản phẩm di chuyển nhanh trên dây chuyền sản xuất, camera tốc độ cao có thể được sử dụng để giám sát chúng và phát hiện bất kỳ sự bất thường nào.

Mặt khác, camera quay chậm có thể được sử dụng để quay phim ở tốc độ khung hình cao rồi giảm tốc độ phát lại. Điều này cho phép người xem quan sát các chi tiết thường bị bỏ lỡ trong thời gian thực. Các camera này được sử dụng để đánh giá hiệu suất của súng đạn và vật liệu nổ. Khả năng làm chậm và phân tích các chuyển động phức tạp rất lý tưởng cho loại ứng dụng này.

Trong một số tình huống nhất định, việc kết hợp camera tốc độ cao và camera quay chậm có thể giúp phân tích chi tiết các đối tượng chuyển động nhanh và chậm trong cùng một sự kiện. Giả sử chúng ta đang phân tích một trận đấu golf. Camera tốc độ cao có thể đo tốc độ của quả bóng golf, trong khi camera quay chậm có thể phân tích các chuyển động vung gậy và kiểm soát cơ thể của người chơi golf.

Computer vision và camera tốc độ cao đang phân tích cú swing của người chơi gôn

Hình 5. Sử dụng thị giác máy tính và camera tốc độ cao để phân tích cú vung gậy của golfer.

Link to this sectionHình ảnh đa phổ trong thị giác máy tính#

Camera đa phổ là các thiết bị chuyên dụng có thể ghi lại nhiều bước sóng của phổ ánh sáng, bao gồm cả tia cực tím và tia hồng ngoại, trong một lần chụp. Hình ảnh đa phổ cung cấp dữ liệu chi tiết có giá trị mà các camera truyền thống không thể thu được. Tương tự như camera siêu phổ (hyperspectral), vốn ghi lại các dải ánh sáng hẹp và liên tục hơn nữa, camera đa phổ được sử dụng trong các lĩnh vực như nông nghiệp, địa chất, giám sát môi trườnghình ảnh y tế. Ví dụ, trong chăm sóc sức khỏe, camera đa phổ có thể giúp hình dung các mô khác nhau bằng cách chụp ảnh qua nhiều bước sóng.

So sánh hình ảnh RGB, đa phổ và siêu phổ

Hình 6. So sánh hình ảnh RGB, đa phổ và siêu phổ.

Tương tự, flycam được trang bị hình ảnh đa phổ đang tạo ra những bước tiến đáng kể trong nông nghiệp. Chúng có thể xác định các loại cây không khỏe mạnh hoặc những cây bị côn trùng và sâu bệnh tấn công ở giai đoạn đầu. Các camera này có thể phân tích phổ cận hồng ngoại, và thực vật khỏe mạnh thường phản xạ nhiều ánh sáng cận hồng ngoại hơn so với những thực vật không khỏe mạnh. Bằng cách áp dụng các kỹ thuật AI như vậy trong nông nghiệp, nông dân có thể thực hiện các biện pháp đối phó sớm để tăng năng suất và giảm thất thoát mùa màng.

Link to this sectionCamera LiDAR cho xe tự lái#

Camera LiDAR (Phát hiện và đo khoảng cách bằng ánh sáng) sử dụng các xung laser để tạo bản đồ 3D và phát hiện đối tượng từ xa. Chúng hoạt động hiệu quả trong nhiều điều kiện như sương mù, mưa, bóng tối và nhiệt độ cao, mặc dù thời tiết khắc nghiệt như mưa hoặc sương mù có thể ảnh hưởng đến hiệu suất của chúng. LiDAR thường được sử dụng trong các ứng dụng như xe tự lái để điều hướng và phát hiện vật cản.

LiDAR hoạt động như đôi mắt của chiếc xe, gửi đi các xung laser và đo khoảng thời gian để chúng phản xạ trở lại. Những hiểu biết này giúp chiếc xe tính toán khoảng cách và nhận diện các đối tượng như xe hơi, người đi bộ và tín hiệu giao thông, cung cấp tầm nhìn 360 độ để lái xe an toàn hơn.

Link to this sectionTóm tắt mọi thứ#

Khi nói đến thị giác máy tính, camera đóng vai trò là đôi mắt cho phép máy móc nhìn và diễn giải thế giới tương tự như cách con người làm. Việc chọn đúng loại camera là chìa khóa cho sự thành công của các ứng dụng thị giác máy tính khác nhau. Từ camera RGB tiêu chuẩn đến hệ thống LiDAR tiên tiến, mỗi loại đều mang đến những tính năng độc đáo phù hợp cho các tác vụ cụ thể. Bằng cách hiểu rõ sự đa dạng của các công nghệ camera và cách sử dụng của chúng, các nhà phát triển và nhà nghiên cứu có thể tối ưu hóa tốt hơn các mô hình thị giác máy tính để giải quyết các thách thức phức tạp trong thế giới thực.

Khám phá thêm về AI bằng cách xem kho lưu trữ GitHub của chúng tôi. Tham gia cộng đồng của chúng tôi để kết nối với những người đam mê vision AI khác. Tìm hiểu thêm về các ứng dụng thị giác máy tính trong chăm sóc sức khỏesản xuất trên các trang giải pháp của chúng tôi.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning