Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Thị giác máy

Machine Vision là gì? Tìm hiểu cách bộ môn AI này cho phép tự động hóa công nghiệp, kiểm soát chất lượng và robot học. Khám phá những khác biệt chính của nó so với Computer Vision.

Thị giác Máy (Machine Vision) là ngành kỹ thuật và công nghệ cho phép kiểm tra tự động, kiểm soát quy trình và điều khiển robot bằng cách phân tích hình ảnh. Nó hoạt động như "đôi mắt" của tự động hóa công nghiệp, kết hợp phần cứng quang học với phần mềm tinh vi để diễn giải dữ liệu trực quan và kích hoạt các hành động vật lý. Mặc dù dựa nhiều vào các nguyên lý lý thuyết của Thị giác Máy tính (CV) , thị giác máy lại khác biệt ở chỗ tập trung vào việc triển khai thực tế trong các môi trường có cấu trúc. Công nghệ này là nền tảng của Công nghiệp 4.0 , cho phép các nhà máy thông minh vận hành với tốc độ, độ chính xác và tính nhất quán cao hơn so với khả năng của con người.

Thành phần cốt lõi và chức năng

Một hệ thống thị giác máy điển hình tích hợp nhiều thành phần quan trọng để thực hiện một nhiệm vụ cụ thể một cách đáng tin cậy. Quá trình này bắt đầu bằng việc thu thập hình ảnh , trong đó các camera công nghiệp chất lượng cao và ống kính chuyên dụng ghi lại dữ liệu hình ảnh. Điều quan trọng là các hệ thống này sử dụng các kỹ thuật chiếu sáng được thiết kế để làm nổi bật các đặc điểm liên quan, chẳng hạn như kết cấu bề mặt hoặc các cạnh, đồng thời triệt tiêu nhiễu.

Sau khi chụp ảnh, hình ảnh sẽ được xử lý bởi một đơn vị tính toán - thường là thiết bị điện toán biên hoặc camera thông minh - chạy các thuật toán tiên tiến. Trước đây, đây là các hệ thống dựa trên quy tắc (ví dụ: đếm pixel), nhưng các ứng dụng hiện đại ngày càng dựa vào Trí tuệ Nhân tạo (AI)Học sâu (DL) . Các mô hình như Ultralytics YOLO11 phân tích hình ảnh để xác định các mẫu, detect khuyết tật hoặc đo kích thước. Sau đó, hệ thống đưa ra quyết định—chẳng hạn như chấp nhận sản phẩm hoặc điều khiển cánh tay robot—và truyền thông tin này đến Bộ điều khiển logic lập trình (PLC) .

Thị giác máy so với Thị giác máy tính

Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, điều quan trọng là phải phân biệt Thị giác Máy tính (Machine Vision) với lĩnh vực Thị giác Máy tính rộng hơn. Thị giác máy tính là một lĩnh vực khoa học tập trung vào việc cho phép máy tính "hiểu" hình ảnh nói chung, thường xử lý dữ liệu phi cấu trúc như ảnh trên mạng xã hội hoặc cảnh quay giám sát. Nó bao gồm các nhiệm vụ từ phân loại hình ảnh đến AI tạo sinh.

Ngược lại, thị giác máy là ứng dụng của các công nghệ này để giải quyết các vấn đề công nghiệp. Hệ thống thị giác máy thường hoạt động trong môi trường được kiểm soát với ánh sáng và vị trí camera đồng nhất để đảm bảo độ tin cậy cao . Ví dụ, trong khi một mô hình thị giác máy tính có thể cố gắng nhận dạng một con chó trong công viên, thì hệ thống thị giác máy được thiết kế để detect một vết xước nhỏ trên vòng piston chuyển động với tốc độ cao trên băng tải.

Các Ứng dụng Thực tế

Công nghệ thị giác máy tính thúc đẩy hiệu quả trong nhiều lĩnh vực bằng cách tự động hóa các tác vụ trực quan.

  • Kiểm soát chất lượng tự động: Trong lĩnh vực sản xuất , hệ thống thị giác máy thực hiện Kiểm tra quang học tự động (AOI) để detect Các khuyết tật vô hình với mắt thường. Sử dụng mô hình phát hiện vật thể , các hệ thống này có thể ngay lập tức xác định các lỗi như vết nứt, vết lõm hoặc thiếu linh kiện trên dây chuyền lắp ráp, đảm bảo chỉ những sản phẩm chất lượng cao mới đến được thị trường.
  • Robot dẫn đường bằng thị giác: Thị giác máy là công nghệ thiết yếu cho robot hiện đại. Nó cho phép robot định vị và nhặt vật thể từ thùng chứa (lấy vật thể từ thùng chứa) hoặc định vị chính xác các bộ phận để lắp ráp. Bằng cách tích hợp ước lượng tư thế , robot có thể hiểu được hướng của vật thể trong không gian 3D, cho phép tương tác động với môi trường thay vì đi theo các đường dẫn được lập trình sẵn.

Triển khai thị giác máy với YOLO11

Thị giác máy hiện đại thường sử dụng mạng nơ-ron tiên tiến để đạt hiệu suất mạnh mẽ. Ví dụ sau đây minh họa cách sử dụng ultralytics Python gói để tải một YOLO11 người mẫu và thực hiện suy luận, một bước phổ biến trong việc xác minh các bộ phận trên dây chuyền sản xuất.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model (or a custom-trained industrial model)
model = YOLO("yolo11n.pt")

# Run inference on an image of a manufactured component
# This step identifies objects and checks for defects based on training
results = model("production_part.jpg")

# Display the results to visualize detections and confidence scores
results[0].show()

Quy trình làm việc đơn giản này hỗ trợ các hệ thống phức tạp, trong đó suy luận thời gian thực quyết định số phận tức thời của sản phẩm trên dây chuyền sản xuất nhanh, giảm thiểu độ trễ suy luận để theo kịp tốc độ sản xuất.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay