Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

PyTorch

Изучите PyTorch, основную библиотеку, на которой основана Ultralytics . Узнайте о ее динамических графах, GPU и о том, как создавать эффективные модели глубокого обучения.

PyTorch библиотека машинного обучения с открытым исходным кодом, разработанная в основном компанией Meta AI, которая стала основой для исследователей и разработчиков в области глубокого обучения. Известная своей гибкостью и простотой использования, она позволяет пользователям создавать и обучать сложные нейронные сети с помощью динамического вычислительного графа. Эта функция, часто называемая «нетерпеливым выполнением», позволяет сразу же оценивать код, что делает отладку и прототипирование значительно более интуитивными по сравнению с фреймворками, которые полагаются на статические определения графов. Она легко интегрируется с языком Python и воспринимается как естественное расширение стандартных инструментов научных вычислений.

Основные механизмы и значение

В основе этой структуры лежат тензоры, которые представляют собой многомерные массивы, аналогичные тем, что описаны в NumPy . Однако, в отличие от стандартных массивов, PyTorch разработаны для использования GPU , предоставляемого NVIDIA CUDA. Это аппаратное ускорение имеет решающее значение для массовой параллельной обработки, необходимой для эффективного обучения современных моделей искусственного интеллекта (ИИ) .

Библиотека поддерживает обширную экосистему инструментов для компьютерного зрения (CV) и обработки естественного языка . Благодаря богатому набору готовых слоев, оптимизаторов и функций потерь она упрощает процесс создания алгоритмов для таких задач, как классификация изображений и моделирование последовательностей.

Применение в реальном мире

Универсальность этой платформы привела к ее внедрению в различных отраслях для создания высокоэффективных решений на базе искусственного интеллекта:

  1. Автономные транспортные средства: Лидеры отрасли используют PyTorch создания моделей глубокого обучения, которые обрабатывают видеопотоки с автомобильных камер. Эти модели выполняют обнаружение объектов в реальном времени для идентификации полос движения, знаков и пешеходов, что обеспечивает более безопасную навигацию.
  2. Медицинская диагностика: Исследователи используют эту платформу для разработки передовых приложений в области здравоохранения. Например , она лежит в основе систем, которые анализируют МРТ-сканы или рентгеновские снимки, чтобы помочь врачам обнаруживать опухоли с помощью точной сегментации изображений.

Сравнение с аналогичными инструментами

Чтобы лучше понять его роль, полезно отличить PyTorch других распространенных инструментов в стеке ИИ:

  • Vs. TensorFlow: Разработанный Google, TensorFlow полагался на статические вычислительные графики, что затрудняло отладку, но оптимизировало развертывание. Хотя оба фреймворка сблизились по функционалу, PyTorch часто PyTorch для быстрого прототипирования и исследований из-за его интуитивно понятного интерфейса.
  • Vs. OpenCV: OpenCV библиотека, ориентированная на традиционные функции обработки изображений (такие как изменение размера, фильтрация и преобразование цвета), а не на обучение нейронных сетей. В типичном рабочем процессе разработчики используют OpenCV предварительной обработки данных перед подачей изображений в PyTorch для анализа.

Интеграция с Ultralytics

Вся линейка Ultralytics , включая передовую YOLO26 и широко используемую YOLO11, изначально построена на PyTorch. Эта основа гарантирует пользователям высокую скорость, стабильность и обширную поддержку сообщества. Независимо от того, выполняется ли перенос обучения на пользовательские данные обучения или экспорт моделей для периферийных устройств, базовая архитектура опирается на PyTorch и градиенты PyTorch .

Предстоящая Ultralytics еще больше упрощает этот процесс, предоставляя унифицированный интерфейс для управления поиском, обучением и развертыванием наборов данных без необходимости написания обширного шаблонного кода.

Следующий пример демонстрирует, как проверить GPU и запустить инференцию с использованием YOLO , показывая, как фреймворк обрабатывает аппаратное ускорение «под капотом»:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас