Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Mạng Nơ-ron (NN)

Khám phá sức mạnh của Mạng Nơ-ron – chìa khóa cho các đổi mới AI và ML như thị giác máy tính, NLP và những đột phá trong học sâu.

Mạng Nơ-ron (NN) là một mô hình tính toán bao gồm các nút được kết nối với nhau, xử lý thông tin bằng cách mô phỏng cấu trúc sinh học của não người. Là nền tảng của Trí tuệ Nhân tạo (AI) hiện đại, các mạng này có khả năng học hỏi từ dữ liệu để nhận dạng các mẫu, classify thông tin và dự đoán kết quả. Mặc dù là một tập hợp con của Học máy (ML) , mạng nơ-ron nhân tạo lại nổi bật nhờ khả năng mô hình hóa các mối quan hệ phi tuyến tính phức tạp, biến chúng thành động lực thúc đẩy các công nghệ đột phá như AI tạo sinh và hệ thống tự động. Bạn có thể tìm hiểu thêm về nguồn cảm hứng sinh học trong bài tổng quan về mạng nơ-ron nhân tạo của IBM .

Kiến trúc của mạng nơ-ron

Cấu trúc của mạng nơ-ron bao gồm các lớp nút, thường được gọi là nơ-ron nhân tạo. Các lớp này tạo điều kiện cho luồng dữ liệu từ đầu vào đến đầu ra thông qua một loạt các phép biến đổi toán học.

  • Lớp đầu vào: Đây là điểm vào nơi mạng nhận dữ liệu đào tạo thô, chẳng hạn như giá trị pixel từ hình ảnh hoặc các đặc điểm số từ tập dữ liệu.
  • Lớp ẩn: Nằm giữa đầu vào và đầu ra, các lớp này thực hiện phần lớn quá trình tính toán. Mỗi nơ-ron trong lớp ẩn áp dụng trọng số và độ lệch mô hình cho đầu vào mà nó nhận được. Để quyết định xem một nơ-ron nên "kích hoạt" hay truyền tín hiệu về phía trước, một hàm kích hoạt —chẳng hạn như ReLU hoặc Sigmoid — được áp dụng.
  • Lớp đầu ra: Lớp cuối cùng tạo ra dự đoán của mạng, chẳng hạn như nhãn phân loại (ví dụ: "mèo" so với "chó") hoặc giá trị liên tục.

Để "học", mạng sử dụng một quy trình gọi là huấn luyện mô hình . Trong quá trình huấn luyện, mạng so sánh các dự đoán của nó với các câu trả lời đúng thực tế bằng hàm mất mát . Một thuật toán được gọi là lan truyền ngược sau đó tính toán độ dốc lỗi, và một thuật toán tối ưu hóa như giảm độ dốc ngẫu nhiên ( SGD ) hoặc Adam điều chỉnh trọng số để giảm thiểu lỗi trong nhiều kỷ nguyên .

Mạng nơ-ron so với Học sâu

Người ta thường nhầm lẫn giữa Mạng Nơ-ron với Học Sâu (DL) . Sự khác biệt chính nằm ở độ phức tạp và chiều sâu. Một mạng nơ-ron "nông" có thể chỉ có một hoặc hai lớp ẩn. Ngược lại, Học Sâu bao gồm các mạng nơ-ron "sâu" với nhiều lớp ẩn, cho phép mô hình tự động học các đặc điểm phân cấp. Để tìm hiểu sâu hơn về sự khác biệt này, hãy xem phần giải thích về Học Sâu của MIT News . Trên thực tế, tất cả các mô hình Học Sâu đều là Mạng Nơ-ron, nhưng không phải tất cả Mạng Nơ-ron đều đủ điều kiện là Học Sâu.

Các Ứng dụng Thực tế

Mạng nơ-ron thúc đẩy sự đổi mới trong hầu hết mọi ngành công nghiệp bằng cách tự động hóa các nhiệm vụ trước đây đòi hỏi trí thông minh của con người.

  1. Thị giác Máy tính: Trong lĩnh vực Thị giác Máy tính (CV) , các mạng chuyên biệt được gọi là Mạng Nơ-ron Tích chập (CNN) được sử dụng để phân tích dữ liệu hình ảnh. Ví dụ, Ultralytics YOLO11 sử dụng kiến trúc CNN sâu để phát hiện đối tượng theo thời gian thực, cho phép các ứng dụng từ AI trong nông nghiệp để theo dõi cây trồng đến các tính năng an toàn trong xe tự hành .
  2. Xử lý Ngôn ngữ Tự nhiên: Đối với các tác vụ liên quan đến văn bản và lời nói, các kiến trúc như Mạng Nơ-ron Hồi quy (RNN)Bộ chuyển đổi (Transformer) chiếm ưu thế. Các mạng này hỗ trợ dịch vụ dịch máy và chatbot bằng cách hiểu ngữ cảnh và trình tự. Bạn có thể xem các mô hình này tác động đến các ngành công nghiệp như thế nào trong bài viết này về AI trong chăm sóc sức khỏe , nơi chúng hỗ trợ sao chép ghi chú y tế và phân tích hồ sơ bệnh nhân.

Ví dụ triển khai

Các khuôn khổ hiện đại giúp triển khai mạng nơ-ron dễ dàng. Sau đây là Python mã chứng minh cách tải một mạng nơ-ron được đào tạo trước (cụ thể là YOLO11 ) và chạy suy luận trên một hình ảnh bằng cách sử dụng ultralytics bưu kiện.

from ultralytics import YOLO

# Load a pretrained YOLO11 neural network model
model = YOLO("yolo11n.pt")

# Run inference on an image to detect objects
# The model processes the image through its layers to predict bounding boxes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Công cụ và Hệ sinh thái

Việc xây dựng mạng nơ-ron đòi hỏi các thư viện phần mềm mạnh mẽ. PyTorchTensorFlow là hai nền tảng mã nguồn mở phổ biến nhất, cung cấp hỗ trợ toàn diện cho việc thiết kế kiến trúc tùy chỉnh và tận dụng khả năng tăng tốc GPU để đào tạo nhanh hơn. Đối với những ai đang tìm kiếm trải nghiệm được sắp xếp hợp lý, Nền tảng Ultralytics (ra mắt đầy đủ vào năm 2026) cung cấp một môi trường toàn diện để quản lý tập dữ liệu , các mô hình đào tạo như YOLO11 và xử lý việc triển khai. Để hiểu về phần cứng hỗ trợ các mạng này, hãy tham khảo hướng dẫn về điện toán GPU của NVIDIA .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay