Machine Vision là gì? Tìm hiểu cách bộ môn AI này cho phép tự động hóa công nghiệp, kiểm soát chất lượng và robot học. Khám phá những khác biệt chính của nó so với Computer Vision.
Thị giác Máy (Machine Vision) là ngành kỹ thuật và công nghệ cho phép kiểm tra tự động, kiểm soát quy trình và điều khiển robot bằng cách phân tích hình ảnh. Nó hoạt động như "đôi mắt" của tự động hóa công nghiệp, kết hợp phần cứng quang học với phần mềm tinh vi để diễn giải dữ liệu trực quan và kích hoạt các hành động vật lý. Mặc dù dựa nhiều vào các nguyên lý lý thuyết của Thị giác Máy tính (CV) , thị giác máy lại khác biệt ở chỗ tập trung vào việc triển khai thực tế trong các môi trường có cấu trúc. Công nghệ này là nền tảng của Công nghiệp 4.0 , cho phép các nhà máy thông minh vận hành với tốc độ, độ chính xác và tính nhất quán cao hơn so với khả năng của con người.
Một hệ thống thị giác máy điển hình tích hợp nhiều thành phần quan trọng để thực hiện một nhiệm vụ cụ thể một cách đáng tin cậy. Quá trình này bắt đầu bằng việc thu thập hình ảnh , trong đó các camera công nghiệp chất lượng cao và ống kính chuyên dụng ghi lại dữ liệu hình ảnh. Điều quan trọng là các hệ thống này sử dụng các kỹ thuật chiếu sáng được thiết kế để làm nổi bật các đặc điểm liên quan, chẳng hạn như kết cấu bề mặt hoặc các cạnh, đồng thời triệt tiêu nhiễu.
Sau khi chụp ảnh, hình ảnh sẽ được xử lý bởi một đơn vị tính toán - thường là thiết bị điện toán biên hoặc camera thông minh - chạy các thuật toán tiên tiến. Trước đây, đây là các hệ thống dựa trên quy tắc (ví dụ: đếm pixel), nhưng các ứng dụng hiện đại ngày càng dựa vào Trí tuệ Nhân tạo (AI) và Học sâu (DL) . Các mô hình như Ultralytics YOLO11 phân tích hình ảnh để xác định các mẫu, detect khuyết tật hoặc đo kích thước. Sau đó, hệ thống đưa ra quyết định—chẳng hạn như chấp nhận sản phẩm hoặc điều khiển cánh tay robot—và truyền thông tin này đến Bộ điều khiển logic lập trình (PLC) .
Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, điều quan trọng là phải phân biệt Thị giác Máy tính (Machine Vision) với lĩnh vực Thị giác Máy tính rộng hơn. Thị giác máy tính là một lĩnh vực khoa học tập trung vào việc cho phép máy tính "hiểu" hình ảnh nói chung, thường xử lý dữ liệu phi cấu trúc như ảnh trên mạng xã hội hoặc cảnh quay giám sát. Nó bao gồm các nhiệm vụ từ phân loại hình ảnh đến AI tạo sinh.
Ngược lại, thị giác máy là ứng dụng của các công nghệ này để giải quyết các vấn đề công nghiệp. Hệ thống thị giác máy thường hoạt động trong môi trường được kiểm soát với ánh sáng và vị trí camera đồng nhất để đảm bảo độ tin cậy cao . Ví dụ, trong khi một mô hình thị giác máy tính có thể cố gắng nhận dạng một con chó trong công viên, thì hệ thống thị giác máy được thiết kế để detect một vết xước nhỏ trên vòng piston chuyển động với tốc độ cao trên băng tải.
Công nghệ thị giác máy tính thúc đẩy hiệu quả trong nhiều lĩnh vực bằng cách tự động hóa các tác vụ trực quan.
Thị giác máy hiện đại thường sử dụng mạng nơ-ron tiên tiến để đạt hiệu suất mạnh mẽ. Ví dụ sau đây minh họa cách sử dụng ultralytics Python gói để tải một
YOLO11 người mẫu và thực hiện suy luận, một bước phổ biến trong việc xác minh các bộ phận trên dây chuyền sản xuất.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (or a custom-trained industrial model)
model = YOLO("yolo11n.pt")
# Run inference on an image of a manufactured component
# This step identifies objects and checks for defects based on training
results = model("production_part.jpg")
# Display the results to visualize detections and confidence scores
results[0].show()
Quy trình làm việc đơn giản này hỗ trợ các hệ thống phức tạp, trong đó suy luận thời gian thực quyết định số phận tức thời của sản phẩm trên dây chuyền sản xuất nhanh, giảm thiểu độ trễ suy luận để theo kịp tốc độ sản xuất.