Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Tìm hiểu cách hiệu chỉnh camera (camera calibration) tăng cường AI thị giác bằng cách sửa lỗi biến dạng, cải thiện ước tính độ sâu và nâng cao độ chính xác trong các ứng dụng thị giác máy tính khác nhau.
Camera không nhìn thế giới giống như con người. Thông thường, chúng chụp ảnh bị biến dạng và thay đổi phối cảnh, điều này có thể ảnh hưởng đến độ chính xác của mô hình Vision AI. Hiệu chỉnh camera có thể khắc phục những biến dạng này và đảm bảo rằng các mô hình thị giác máy tính có thể nhận biết các đối tượng như chúng thực sự tồn tại trong thế giới thực. Quá trình này bao gồm hiệu chỉnh độ méo ống kính, điều chỉnh tiêu cự và căn chỉnh cảm biến để giúp camera chụp ảnh chính xác.
Cụ thể, hiệu chuẩn camera chính xác là yếu tố then chốt để ước tính độ sâu và đo khoảng cách chính xác. Các mô hình Vision AI như Ultralytics YOLO11 cần các đầu vào được hiệu chuẩn tốt để thực hiện các tác vụ computer vision khác nhau như object detection và ước tính tư thế (pose estimation). Nếu không có hình ảnh đầu vào phù hợp, hiệu suất của mô hình có thể giảm và dẫn đến lỗi trong các ứng dụng thực tế.
Các phương pháp hiệu chỉnh camera khác nhau, từ các mẫu bàn cờ truyền thống đến các kỹ thuật dựa trên AI tiên tiến, có thể giúp cải thiện độ chính xác. Ví dụ: hiệu chỉnh 3D (ba chiều) giúp các mô hình hiểu độ sâu, trong khi ma trận hiệu chỉnh chuyển đổi tọa độ thế giới thực thành không gian hình ảnh để có độ chính xác tốt hơn.
Trong hướng dẫn này, chúng ta sẽ đề cập đến những kiến thức cơ bản về hiệu chỉnh camera cho thị giác máy tính, bao gồm các thông số chính, các phương pháp khác nhau và tối ưu hóa cho các ứng dụng AI trong thế giới thực.
Tầm quan trọng của hiệu chỉnh camera trong thị giác máy tính
Hiệu chỉnh camera được sử dụng để điều chỉnh cài đặt của camera nhằm đảm bảo hình ảnh khớp chính xác với các phép đo trong thế giới thực. Nó đảm bảo các đối tượng trong hình ảnh xuất hiện ở đúng vị trí, kích thước và tỷ lệ, ngăn ngừa sự biến dạng có thể gây hiểu lầm cho các mô hình AI.
Nếu không được hiệu chỉnh đúng cách, máy ảnh có thể gây ra hiện tượng méo ống kính, khiến các vật thể trông bị kéo dài hoặc lệch lạc. Điều này ảnh hưởng đến độ chính xác của object detection (phát hiện đối tượng), tracking (theo dõi) và depth estimation (ước tính độ sâu), dẫn đến sai sót trong các ứng dụng hỗ trợ AI. Đặc biệt, các mô hình như YOLO11 hoạt động hiệu quả hơn khi dữ liệu đầu vào được hiệu chỉnh đúng cách, giảm thiểu sai sót trong diễn giải không gian và cải thiện việc ra quyết định trong thế giới thực.
Hiệu chỉnh chính xác đặc biệt quan trọng đối với máy bay không người lái, xe tự lái và thị giác robot. Sự sai lệch trong các hệ thống này có thể dẫn đến tính toán khoảng cách không chính xác, ảnh hưởng đến các tác vụ như điều hướng và phát hiện chướng ngại vật.
Hình 1. Một ví dụ về sự biến dạng ống kính (bên trái) được hiệu chỉnh bằng cách sử dụng hiệu chuẩn camera (bên phải).
Tìm hiểu các hiệu ứng biến dạng ống kính
Hiện tượng méo ống kính có thể khiến camera biểu thị sai hình dạng và vị trí của vật thể trong ảnh. Dưới đây là một số ví dụ về các loại méo ống kính khác nhau:
Méo hình thùng (Barrel distortion): Ở đây, các đường thẳng có vẻ cong ra ngoài, làm cho các vật thể ở trung tâm của hình ảnh trông phình to ra. Điều này thường thấy ở các ống kính góc rộng và có thể phá vỡ hiệu chuẩn 3D trong các hệ thống tự hành bằng cách làm sai lệch nhận thức về độ sâu.
Biến dạng gối lõm: Trong trường hợp này, các đường thẳng uốn cong vào trong về phía tâm của hình ảnh, tạo ra hiệu ứng ngược lại với biến dạng thùng.
Biến dạng ria mép (Mustache distortion): Điều này xảy ra khi cả biến dạng thùng (barrel) và gối (pincushion) kết hợp, khiến các đường thẳng bị uốn cong theo hình lượn sóng.
Quang sai màu: Điều này xảy ra khi thấu kính không thể hội tụ các màu tại cùng một điểm, tạo ra các viền màu xung quanh vật thể.
Hiệu chỉnh camera bao gồm hai thành phần chính: các tham số nội tại, xác định các đặc tính bên trong của camera và các tham số ngoại tại, xác định vị trí và hướng của nó so với thế giới. Chúng ta hãy xem xét kỹ hơn cả hai loại thành phần này.
Các tham số nội tại
Hiệu chuẩn nội tại chính xác có thể cải thiện dự đoán của mô hình bằng cách đảm bảo rằng các đối tượng được phát hiện xuất hiện ở đúng vị trí và tỷ lệ trong các ứng dụng thực tế. Dưới đây là một cái nhìn nhanh về một vài tham số nội tại:
Tiêu cự: Nó kiểm soát cách máy ảnh chiếu các vật thể 3D lên hình ảnh 2D. Nếu hiệu chỉnh sai, các vật thể có thể xuất hiện bị kéo dài hoặc nén, làm thay đổi kích thước và khoảng cách cảm nhận của chúng.
Điểm chính: Điểm này đại diện cho tâm quang học của cảm biến máy ảnh. Nếu bị lệch, nó có thể làm dịch chuyển toàn bộ hình ảnh, dẫn đến sự sai lệch trong định vị đối tượng.
Hệ số xiên: Nó tính đến sự sắp xếp pixel không hình chữ nhật trong cảm biến. Khi có độ xiên, hình ảnh có thể xuất hiện bị nghiêng hoặc cong thay vì được căn chỉnh đúng cách.
Hệ số biến dạng: Các tham số này hiệu chỉnh các biến dạng quang học do ống kính gây ra. Nếu không có hiệu chỉnh, các đường thẳng có thể xuất hiện cong, đặc biệt là gần các cạnh của ảnh.
Thông số ngoại tại
Hiệu chuẩn ngoại tại xác định cách máy ảnh được định vị và hướng liên quan đến thế giới thực, điều này đặc biệt quan trọng trong các hệ thống đa máy ảnh được sử dụng để hiệu chuẩn 3D, theo dõi đối tượng và nhận dạng độ sâu. Nó giúp máy bay không người lái, xe tự hành và hệ thống giám sát diễn giải chính xác các mối quan hệ không gian.
Dưới đây là hai tham số ngoại tại chính:
Ma trận tịnh tiến: Ma trận này xác định vị trí vật lý của máy ảnh trong không gian 3D, chỉ định vị trí của nó dọc theo các trục X, Y và Z. Nếu bị hiệu chỉnh sai, các đối tượng có thể xuất hiện gần hơn hoặc xa hơn so với thực tế, dẫn đến các phép đo khoảng cách không chính xác. Trong xe tự hành, điều này có thể dẫn đến khả năng phát hiện chướng ngại vật kém, trong khi trong robot, nó có thể gây ra lỗi định vị trong quá trình thao tác đối tượng.
Ma trận xoay: Nó xác định hướng của máy ảnh bằng cách chỉ định mức độ nghiêng, xoay hoặc tạo góc so với một điểm tham chiếu. Nếu không được hiệu chỉnh chính xác, hình ảnh từ nhiều máy ảnh có thể không căn chỉnh đúng cách, gây ra các vấn đề trong tái tạo 3D, theo dõi đa máy ảnh và lập bản đồ không gian. Ví dụ: trong một chiếc xe tự lái, một ma trận xoay không chính xác có thể làm sai lệch đầu vào cảm biến, dẫn đến phát hiện làn đường không chính xác.
Tìm hiểu về ma trận hiệu chỉnh camera
Mỗi hình ảnh được chụp bởi máy ảnh là một biểu diễn 2D của thế giới 3D. Các mô hình AI cần một cách để dịch giữa các chiều này để đưa ra các dự đoán chính xác. Đây là nơi ma trận hiệu chỉnh máy ảnh xuất hiện. Nó ánh xạ các điểm trong thế giới thực lên mặt phẳng hình ảnh của máy ảnh để các đối tượng xuất hiện ở đúng vị trí.
Nói một cách đơn giản, ma trận hiệu chỉnh camera là một mô hình toán học biểu thị các tham số nội tại của camera. Nó thường được lưu trữ trong các hệ thống thị giác và được sử dụng trong các thuật toán xử lý ảnh để sửa lỗi biến dạng và ánh xạ các điểm 3D thành tọa độ 2D.
Như chúng ta sẽ thấy tiếp theo, ma trận được tính toán bằng cách sử dụng các phương pháp hiệu chỉnh như phát hiện mẫu bàn cờ, hiệu chỉnh dựa trên đối tượng 3D và tự hiệu chỉnh dựa trên AI, ước tính các tham số chính bằng cách phân tích hình ảnh của các điểm tham chiếu đã biết.
Các phương pháp hiệu chỉnh camera khác nhau
Có nhiều phương pháp hiệu chỉnh camera khác nhau, mỗi phương pháp phù hợp với các trường hợp sử dụng cụ thể. Các phương pháp truyền thống dựa trên các mẫu vật lý, trong khi các kỹ thuật dựa trên AI sử dụng deep learning để tự động hóa quy trình.
Hãy cùng xem xét các phương pháp này và khám phá cách chúng cải thiện độ chính xác trong các ứng dụng khác nhau.
Các phương pháp hiệu chỉnh camera truyền thống
Một trong những phương pháp hiệu chuẩn camera phổ biến nhất sử dụng bàn cờ hoặc mẫu lưới được đặt trước camera. Hệ thống phát hiện các điểm chính trong mẫu để tính toán các tham số hiệu chuẩn.
Mặc dù hữu ích trong môi trường được kiểm soát, nhưng nó đòi hỏi các điều chỉnh thủ công và phân tích nhiều hình ảnh từ các góc độ khác nhau. Thay đổi về điều kiện ánh sáng hoặc chuyển động máy ảnh bất ngờ có thể làm giảm độ chính xác, khiến việc hiệu chỉnh lại là cần thiết.
Trong môi trường động, chẳng hạn như máy bay không người lái và xe tự lái, hiệu chuẩn truyền thống gặp khó khăn trong việc theo kịp. Một camera chuyển động đòi hỏi phải hiệu chuẩn lại thường xuyên để duy trì độ chính xác, điều này không thực tế với các mẫu tĩnh. Hạn chế này đã thúc đẩy sự tiến bộ trong hiệu chuẩn camera dựa trên AI, mang lại sự linh hoạt và tự động hóa cao hơn.
Các phương pháp hiệu chỉnh camera được hỗ trợ bởi AI
Các kỹ thuật dựa trên AI tự động hóa việc hiệu chỉnh camera bằng cách sử dụng các mô hình deep learning để tự hiệu chỉnh, giảm nhu cầu điều chỉnh thủ công. Các phương pháp này ước tính các tham số nội tại và ngoại tại trực tiếp từ hình ảnh thế giới thực, loại bỏ nhu cầu về các mẫu được xác định trước.
Tương tự, bộ dữ liệu tổng hợp đang thay đổi phương pháp hiệu chỉnh camera bằng cách cung cấp cho các mô hình AI dữ liệu huấn luyện đa dạng, được gắn nhãn để tinh chỉnh các tham số và sửa lỗi biến dạng. Các bộ dữ liệu này mô phỏng các điều kiện thực tế, giúp các mô hình AI học cách điều chỉnh các tham số nội tại và ngoại tại một cách linh hoạt mà không cần sự can thiệp của con người.
Ví dụ: các framework tự hiệu chỉnh sử dụng các mô hình xác suất và deep learning để phân tích hình ảnh đơn (monocular), ước tính cấu trúc 3D và liên tục tinh chỉnh hiệu chuẩn. Dữ liệu tổng hợp (Synthetic data) tăng cường quy trình này bằng cách huấn luyện các mô hình xử lý các góc nhìn khác nhau, sự sai lệch của cảm biến và điều kiện ánh sáng, cải thiện ước tính độ sâu, theo dõi vật cản và độ chính xác không gian trong các ứng dụng như xe tự hành và robot.
Hình 4. Một hệ thống Vision AI tự hiệu chỉnh có thể hiểu được giao thông.
Các ứng dụng chính của hiệu chỉnh camera
Bây giờ chúng ta đã hiểu camera calibration là gì, hãy khám phá tác động của nó trên nhiều ngành công nghiệp khác nhau.
Xe tự hành và điều hướng bằng máy bay không người lái
Đối với xe tự lái và máy bay không người lái tự động, việc hiệu chỉnh camera chính xác là rất quan trọng để điều hướng an toàn và đáng tin cậy. Các hệ thống này dựa vào ước tính độ sâu và tính toán khoảng cách để phát hiện chướng ngại vật, theo dõi vạch kẻ đường và đánh giá các vật thể xung quanh. Hiệu chuẩn kém có thể gây ra sự hiểu sai về khoảng cách, dẫn đến các quyết định không chính xác trong các tình huống thời gian thực.
Một ma trận được hiệu chỉnh đúng cách cho phép xe tự hành hợp nhất các đầu vào từ LiDAR, radar và camera, cải thiện khả năng hợp nhất đa cảm biến. Điều này giúp xe đo chính xác khoảng cách đến người đi bộ, ranh giới làn đường và các xe ô tô gần đó, giảm nguy cơ tai nạn. Trong khi đó, trên máy bay không người lái, hiệu chuẩn 3D giúp duy trì sự ổn định độ cao và theo dõi các đối tượng chính xác để điều hướng chính xác trong môi trường động.
Hình 5. Một camera đã được hiệu chỉnh trong một chiếc xe tự lái.
Thực tế tăng cường (AR) và thực tế ảo (VR)
Các ứng dụng AR và VR dựa vào hiệu chuẩn camera chính xác để căn chỉnh nội dung kỹ thuật số với các đối tượng trong thế giới thực. Nếu không được hiệu chuẩn đúng cách, lớp phủ AR có thể bị trôi, xuất hiện sai lệch hoặc tỷ lệ không chính xác, làm gián đoạn trải nghiệm người dùng.
Hiệu chỉnh biến dạng ống kính là chìa khóa để làm cho các đối tượng ảo hòa trộn liền mạch vào môi trường thực. Nếu không có nó, sự biến dạng có thể phá vỡ sự đắm chìm và giảm độ chính xác trong trò chơi, mô phỏng đào tạo và chẩn đoán hình ảnh y tế. Hơn nữa, trong VR, hiệu chỉnh giúp tăng cường theo dõi chính xác các chuyển động của đầu và tay, cải thiện khả năng phản hồi và tạo ra trải nghiệm mượt mà và sống động hơn.
Hình 6. Thiết lập hiệu chỉnh camera 3D được sử dụng để tinh chỉnh các phép đo không gian.
Thị giác máy và tự động hóa công nghiệp
Để robot có thể nhìn và tương tác với thế giới một cách chính xác, việc hiệu chỉnh camera phù hợp là rất quan trọng. Trong tự động hóa công nghiệp, robot dựa vào ước tính độ sâu để nhặt, đặt và điều khiển các vật thể một cách chính xác. Nếu không hiệu chỉnh đúng cách, sự sai lệch có thể gây ra lỗi trong đóng gói, lắp ráp và kiểm tra kiểm soát chất lượng.
Một thách thức chính trong ngành robot là đo lường chính xác các vật thể phẳng. Hiệu chuẩn giúp cánh tay robot phát hiện các kích thước chính xác, ngăn ngừa các tính toán sai có thể làm chậm hoặc gián đoạn quá trình sản xuất. Hiệu chuẩn 3D tiến thêm một bước nữa bằng cách cho phép robot thích ứng khi các đối tượng hoặc vị trí thay đổi.
Những điều cần nhớ
Hiệu chỉnh camera là một thành phần quan trọng của nhiều giải pháp thị giác máy tính. Nó đảm bảo các mô hình AI diễn giải hình ảnh một cách chính xác cho các tác vụ như phát hiện đối tượng, theo dõi và ước tính độ sâu. Các tham số nội tại và ngoại tại giúp căn chỉnh hình ảnh với các phép đo trong thế giới thực để ngăn chặn sự biến dạng có thể ảnh hưởng đến các ứng dụng do AI điều khiển.
Hiệu chỉnh biến dạng ống kính là rất quan trọng đối với các ứng dụng thực tế tăng cường, tự động hóa công nghiệp và hệ thống đa camera. Khi AI tiến bộ, các phương pháp hiệu chỉnh camera tự động đang cải thiện hiệu quả, độ chính xác và độ tin cậy lâu dài trong các ứng dụng thực tế.