Khám phá cách Mạng nơ-ron tích chập (CNN) vận hành thị giác máy tính hiện đại. Tìm hiểu về các lớp, ứng dụng và cách chạy chúng. Ultralytics YOLO26 dành cho trí tuệ nhân tạo thời gian thực.
Mạng nơ-ron tích chập (CNN) là một kiến trúc học sâu chuyên biệt được thiết kế để xử lý dữ liệu có cấu trúc dạng lưới, đặc biệt là hình ảnh kỹ thuật số. Lấy cảm hứng từ cấu trúc sinh học của vỏ não thị giác , CNN có khả năng độc đáo trong việc bảo toàn các mối quan hệ không gian trong dữ liệu đầu vào. Không giống như các mạng nơ-ron truyền thống làm phẳng hình ảnh thành một danh sách dài các con số, CNN phân tích các vùng nhỏ, chồng chéo của hình ảnh để tự động học các hệ thống phân cấp đặc trưng—từ các cạnh và kết cấu đơn giản đến các hình dạng và đối tượng phức tạp. Khả năng này khiến chúng trở thành công nghệ nền tảng đằng sau các hệ thống thị giác máy tính (CV) hiện đại.
Sức mạnh của mạng nơ-ron tích chập (CNN) nằm ở khả năng giảm bớt một hình ảnh phức tạp thành dạng dễ xử lý hơn mà không làm mất đi các đặc điểm quan trọng để đưa ra dự đoán chính xác. Điều này đạt được thông qua một chuỗi các lớp riêng biệt chuyển đổi dữ liệu đầu vào thành một lớp hoặc giá trị đầu ra:
Mạng nơ-ron tích chập (CNN) đã làm thay đổi nhiều ngành công nghiệp bằng cách tự động hóa các tác vụ xử lý hình ảnh với độ chính xác siêu phàm.
Mặc dù mạng nơ-ron tích chập (CNN) từ lâu đã là tiêu chuẩn cho các tác vụ xử lý hình ảnh, một kiến trúc mới hơn gọi là Vision Transformer (ViT) đã xuất hiện.
Các thư viện hiện đại giúp việc sử dụng các mô hình dựa trên CNN trở nên dễ dàng hơn. ultralytics Gói phần mềm này cung cấp quyền truy cập vào các mô hình tiên tiến như YOLO26, với kiến trúc mạng CNN được tối ưu hóa cao để suy luận nhanh chóng.
Ví dụ sau đây minh họa cách tải mô hình CNN đã được huấn luyện trước và thực hiện dự đoán:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
Việc phát triển mạng nơ-ron tích chập (CNN) được hỗ trợ bởi một hệ sinh thái mạnh mẽ gồm các công cụ mã nguồn mở. Các kỹ sư thường sử dụng các framework như PyTorch hoặc TensorFlow để xây dựng các kiến trúc tùy chỉnh. Các thư viện này cung cấp các chức năng cấp thấp. tensor các phép toán cần thiết cho phép tích chập và lan truyền ngược .
Đối với các nhóm đang tìm cách tối ưu hóa vòng đời của các dự án thị giác máy tính—từ thu thập dữ liệu đến triển khai— Nền tảng Ultralytics cung cấp một giải pháp toàn diện. Nó đơn giản hóa các quy trình làm việc phức tạp, cho phép các nhà phát triển tập trung vào việc áp dụng mạng nơ-ron tích chập (CNN) để giải quyết các vấn đề kinh doanh thay vì quản lý cơ sở hạ tầng. Ngoài ra, các mô hình có thể được xuất sang các định dạng như ONNX hoặc TensorRT để triển khai hiệu suất cao trên các thiết bị biên.