Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

PyTorch

Phát hiện PyTorch , sự linh hoạt, Python -khung học máy đầu tiên hỗ trợ các cải tiến AI như Ultralytics YOLO . Xây dựng thông minh hơn, nhanh hơn ngay hôm nay!

PyTorch là một nền tảng học máy (ML)học sâu (DL) mã nguồn mở hàng đầu, hỗ trợ phát triển các hệ thống thông minh. Ban đầu được phát triển bởi các nhà nghiên cứu tại Meta AI , PyTorch Foundation hiện được quản lý bởi PyTorch Foundation độc lập, đảm bảo sự phát triển trung lập và hướng đến cộng đồng. Nổi tiếng với tính linh hoạt và thiết kế "Pythonic", PyTorch cho phép các nhà phát triển xây dựng các kiến trúc mạng nơ-ron (NN) phức tạp với mã nguồn tự nhiên và trực quan trong hệ sinh thái Python .

Về cơ bản, khung này hoạt động trên các tenxơ , là các mảng đa chiều tương tự như các mảng trong thư viện NumPy . Tuy nhiên, không giống như các mảng tiêu chuẩn, các cấu trúc dữ liệu này có thể được xử lý trên GPU để tăng tốc đáng kể tốc độ tính toán. Khả năng này rất cần thiết để xử lý khối lượng xử lý song song khổng lồ cần thiết khi đào tạo các mô hình AI hiện đại cho các tác vụ như thị giác máy tính (CV) và hiểu ngôn ngữ tự nhiên.

Các tính năng và ưu điểm chính

PyTorch phân biệt chính nó với các khuôn khổ khác thông qua một tập hợp các lựa chọn thiết kế cụ thể ưu tiên năng suất của nhà phát triển và khả năng gỡ lỗi dễ dàng:

  • Đồ thị tính toán động: Không giống như các khuôn khổ trước đây sử dụng đồ thị tĩnh (xác định mạng trước khi chạy), PyTorch áp dụng triết lý "xác định bằng chạy". Điều này cho phép các nhà phát triển chỉnh sửa đồ thị ngay lập tức, giúp gỡ lỗi và xử lý các đầu vào có độ dài thay đổi dễ dàng hơn, đặc biệt hữu ích trong xử lý ngôn ngữ tự nhiên (NLP) .
  • Phân biệt tự động: Khung bao gồm một mô-đun được gọi là autograd tự động tính toán độ dốc—các đạo hàm toán học cần thiết cho lan truyền ngược. Điều này đơn giản hóa việc thực hiện thuật toán tối ưu hóa trong quá trình đào tạo.
  • Hệ sinh thái mạnh mẽ: Được hỗ trợ bởi các thư viện dành riêng cho từng miền như TorchVision dành cho tác vụ hình ảnh, cung cấp các mô hình và tập dữ liệu được đào tạo trước, và TorchAudio dành cho xử lý âm thanh.
  • Triển khai liền mạch: Với các công cụ như TorchScript , các mô hình có thể được chuyển đổi từ môi trường nghiên cứu sang triển khai sản xuất mà không cần phụ thuộc nhiều, hỗ trợ phục vụ mô hình hiệu quả.

Các Ứng dụng Thực tế

Tính linh hoạt của khuôn khổ này đã dẫn đến việc áp dụng rộng rãi trong nhiều ngành công nghiệp khác nhau cho các ứng dụng có tác động cao:

  1. Lái xe tự động: Các công ty như Tesla sử dụng các mô hình học sâu được xây dựng trên PyTorch để xử lý dữ liệu video từ camera xe. Các mô hình này thực hiện phát hiện vật thể theo thời gian thực để xác định làn đường, người đi bộ và các phương tiện khác, cho phép xe tự hành di chuyển an toàn.
  2. Chẩn đoán chăm sóc sức khỏe: Trong lĩnh vực phân tích hình ảnh y tế , các nhà nghiên cứu sử dụng khuôn khổ để đào tạo các mô hình detect Các bất thường trong chụp X-quang và chụp MRI. Ví dụ, NVIDIA Clara tận dụng những khả năng này để hỗ trợ các bác sĩ X-quang xác định khối u với độ chính xác cao hơn bằng cách phân đoạn hình ảnh .

PyTorch so với các công cụ khác

Để hiểu nơi nào PyTorch phù hợp với bộ công cụ dành cho nhà phát triển, sẽ hữu ích khi phân biệt nó với các công nghệ liên quan:

  • Vs. TensorFlow : Mặc dù cả hai đều là khuôn khổ học sâu toàn diện, TensorFlow (được phát triển bởi Google ) trước đây được biết đến với các biểu đồ tĩnh và quy trình triển khai phức tạp. PyTorch thường được ưa chuộng trong nghiên cứu và tạo mẫu nhanh do tính năng động và dễ sử dụng, mặc dù cả hai đều có những tính năng hội tụ theo thời gian.
  • So với OpenCV : OpenCV là một thư viện chuyên xử lý hình ảnh truyền thống (thay đổi kích thước, lọc, chuyển đổi màu) thay vì học sâu. Trong quy trình làm việc thông thường, các nhà phát triển sử dụng OpenCV để xử lý dữ liệu trước khi đưa hình ảnh vào PyTorch mạng nơ-ron để phân tích.

Tích hợp với Ultralytics

Tất cả các mô hình Ultralytics YOLO11 đều được xây dựng gốc trên PyTorch Điều này đảm bảo người dùng được hưởng lợi từ tốc độ và sự hỗ trợ cộng đồng rộng rãi của nền tảng. Cho dù tham gia vào việc học chuyển giao trên một tập dữ liệu tùy chỉnh hay triển khai một mô hình cho điện toán biên, kiến trúc cơ bản đều tận dụng PyTorch tenxơ và gradien.

Nền tảng Ultralytics sắp ra mắt sẽ đơn giản hóa trải nghiệm này hơn nữa, cung cấp giao diện hợp lý để đào tạo và quản lý các mô hình này mà không cần phải viết mã mẫu dài dòng.

Ví dụ sau đây minh họa cách tải một mô hình được đào tạo trước và chạy suy luận, cho thấy cách thức hoạt động của khuôn khổ để xử lý các phép tính nặng:

from ultralytics import YOLO

# Load a standard YOLO11 model (built on PyTorch)
model = YOLO("yolo11n.pt")

# Perform object detection on an image
# PyTorch handles the tensor operations and GPU acceleration automatically
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects.")

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay