Khám phá cách thị giác máy tính tự động hóa việc kiểm tra và hướng dẫn trong công nghiệp. Tìm hiểu cách triển khai. Ultralytics YOLO26 dành cho việc phát hiện lỗi theo thời gian thực và độ chính xác của robot.
Thị giác máy tính đề cập đến sự tích hợp các cảm biến quang học, phần cứng xử lý hình ảnh kỹ thuật số và thuật toán xử lý hình ảnh vào thiết bị công nghiệp để tự động hóa các tác vụ kiểm tra và hướng dẫn trực quan. Mặc dù có chung nền tảng với các công nghệ trí tuệ nhân tạo rộng hơn, thị giác máy tính khác biệt ở trọng tâm kỹ thuật là tương tác với môi trường vật lý trong thời gian thực. Nó hoạt động như "đôi mắt" của dây chuyền sản xuất hoặc hệ thống tự động, thu thập dữ liệu hình ảnh cho phép hệ thống điều khiển xác định khuyết tật, phân loại sản phẩm và hướng dẫn cánh tay robot với độ chính xác cao. Bằng cách kết hợp các camera chuyên dụng với phần mềm phức tạp, các hệ thống này cải thiện kiểm soát chất lượng và hiệu quả hoạt động trong các lĩnh vực từ sản xuất ô tô đến đóng gói dược phẩm.
Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, nhưng vẫn có sự khác biệt về chức năng giữa thị giác máy và thị giác máy tính . Thị giác máy tính (CV) là lĩnh vực học thuật và công nghệ bao quát liên quan đến việc trích xuất thông tin có ý nghĩa từ hình ảnh kỹ thuật số. Thị giác máy (MV) đặc biệt đề cập đến việc ứng dụng CV trong môi trường công nghiệp hoặc thực tiễn, nơi hệ thống phải tương tác với các phần cứng khác.
Ví dụ, một mô hình thị giác máy tính có thể phân tích tập dữ liệu y tế để tìm ra xu hướng trong ảnh chụp X-quang, trong khi một hệ thống thị giác máy sử dụng điện toán biên để kích hoạt bộ truyền động khí nén, loại bỏ chai bị nứt trên băng chuyền trong vòng mili giây. Các hệ thống thị giác máy ưu tiên tốc độ, độ tin cậy và khả năng tích hợp với các thiết bị đầu vào/đầu ra (I/O), thường triển khai các mô hình lên các thiết bị nhúng để đạt hiệu suất độ trễ thấp.
Một hệ thống thị giác máy tính điển hình dựa trên một chuỗi tích hợp chặt chẽ giữa phần cứng và phần mềm. Nó bắt đầu với hệ thống con thu nhận hình ảnh, bao gồm hệ thống chiếu sáng chuyên dụng để làm nổi bật các chi tiết và các cảm biến hình ảnh (như CMOS hoặc CCD) để thu thập các khung hình có độ phân giải cao. Dữ liệu này được truyền đến một bộ xử lý—thường là một máy tính công nghiệp hoặc một camera thông minh—nơi các thuật toán phân tích dữ liệu pixel.
Các hệ thống hiện đại ngày càng sử dụng học sâu để xử lý các biến thể phức tạp mà các thuật toán dựa trên quy tắc truyền thống không thể giải quyết được. Mạng nơ-ron, chẳng hạn như YOLO26 tiên tiến nhất hiện nay, cho phép các hệ thống thị giác máy học hỏi từ các ví dụ thay vì dựa vào lập trình cứng nhắc. Sự thay đổi này cho phép sản xuất thích ứng , nơi các hệ thống có thể nhận dạng các biến thể sản phẩm mới mà không cần lập trình lại nhiều.
Thị giác máy tính thúc đẩy tự động hóa trong nhiều ngành công nghiệp khác nhau, đảm bảo tính nhất quán mà việc kiểm tra của con người không thể đạt được.
Trong sản xuất điện tử, hệ thống AOI đóng vai trò quan trọng trong việc đảm bảo chất lượng. Khi các bo mạch điện tử ngày càng nhỏ và phức tạp hơn, mắt người khó có thể kiểm tra các linh kiện. Hệ thống thị giác máy tính sử dụng phương pháp phát hiện đối tượng để xác định các linh kiện bị thiếu, bị lệch hoặc không chính xác trên bo mạch in (PCB). Bằng cách sử dụng phân đoạn đối tượng , hệ thống có thể tính toán chính xác khu vực hàn để đảm bảo kết nối điện. Nếu phát hiện lỗi, hệ thống sẽ tự động đánh dấu bo mạch để sửa chữa, ngăn chặn các thiết bị điện tử lỗi đến tay người tiêu dùng.
Robot được sử dụng trong lĩnh vực hậu cần và kho bãi dựa vào thị giác máy tính để điều hướng và thao tác. Trong một quy trình gọi là gắp hàng từ thùng chứa, robot phải định vị các vật phẩm được xếp chồng ngẫu nhiên và gắp chúng một cách chính xác. Điều này đòi hỏi ước lượng tư thế , xác định hướng và các điểm chính của vật thể trong không gian 3D. Bằng cách xử lý đầu vào hình ảnh, robot điều chỉnh góc gắp của nó một cách linh hoạt. Sự tích hợp trí tuệ nhân tạo (AI) trong robot cho phép tạo ra các dây chuyền tự động hóa linh hoạt có thể xử lý các hình dạng sản phẩm khác nhau mà không cần phải thay đổi công cụ cơ khí.
Việc phát triển các ứng dụng thị giác máy tính đã trở nên dễ tiếp cận hơn đáng kể nhờ các framework hiện đại. Nền tảng Ultralytics đơn giản hóa quá trình gắn nhãn các tập dữ liệu công nghiệp và huấn luyện các mô hình được tối ưu hóa cho việc triển khai tại biên. Dưới đây là một ví dụ về cách nhà phát triển có thể sử dụng Python để chạy kiểm tra phát hiện lỗi bằng cách sử dụng phiên bản mới nhất. YOLO người mẫu.
from ultralytics import YOLO
# Load a custom YOLO26 model trained for detecting manufacturing defects
# 'yolo26n.pt' is the nano version, optimized for high-speed inference
model = YOLO("yolo26n.pt")
# Run inference on an image from the production line
# 'conf=0.6' sets a strict confidence threshold to avoid false positives
results = model.predict(source="conveyor_belt_feed.jpg", conf=0.6)
# Process results to trigger an action (e.g., stopping the line)
for r in results:
if len(r.boxes) > 0:
print(f"Defect Detected: {r.names[int(r.boxes.cls[0])]}")
# Logic to trigger hardware rejection mechanism would go here
Thị giác máy tính là trụ cột của Công nghiệp 4.0 , tạo điều kiện thuận lợi cho việc xây dựng các nhà máy thông minh, nơi dữ liệu được truyền tải liền mạch giữa các cảm biến hình ảnh và hệ thống quản lý trung tâm. Khi các công nghệ như tạo dữ liệu tổng hợp được cải thiện, việc huấn luyện các mô hình thị giác để phát hiện các lỗi hiếm gặp trở nên dễ dàng hơn, từ đó nâng cao hơn nữa độ tin cậy của hệ thống. Sự hội tụ của kết nối 5G và trí tuệ nhân tạo biên (edge AI) đảm bảo rằng thị giác máy tính sẽ tiếp tục là động lực chính thúc đẩy tính tự chủ và hiệu quả công nghiệp.