Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

GPU (графический процессор)

Узнайте, как GPU совершают революцию в области ИИ и машинного обучения, ускоряя глубокое обучение, оптимизируя рабочие процессы и обеспечивая применение в реальных условиях.

Графический процессор (GPU) — это специализированная электронная схема, изначально разработанная для ускорения обработки и создания изображений в буфере кадра для вывода на дисплей. Хотя их корни лежат в рендеринге компьютерной графики для игр и профессиональной визуализации, GPU превратились в фундаментальный двигатель современного искусственного интеллекта (ИИ). В отличие от стандартного процессора, который использует несколько мощных ядер для последовательной обработки задач, GPU состоит из тысяч более мелких, эффективных ядер, предназначенных для одновременной обработки нескольких задач. Эта способность, известная как параллельные вычисления, делает их исключительно эффективными для массивных матричных и векторных операций, лежащих в основе глубокого обучения (DL) и сложных нейронных сетей (NN).

Ускорение рабочих нагрузок ИИ

Основная причина, по которой графические процессоры незаменимы для машинного обучения (ML), — это их способность выполнять высокоскоростное умножение матриц. Фреймворки глубокого обучения, такие как PyTorch и TensorFlow специально оптимизированы для использования этого аппаратного ускорения. Это приводит к значительному сокращению времени обучения моделей, часто превращая недели вычислений на стандартном процессоре в часы на GPU. Вычислительная пропускная способность этих устройств обычно измеряется в FLOPS (операции с плавающей запятой в секунду), что является важным показателем для оценки способности аппаратного обеспечения справляться с жесткими требованиями современных моделей, таких как YOLO26.

Аппаратные различия: GPU vs. CPU vs. TPU

Чтобы понять особенности аппаратного обеспечения, полезно отличать GPU других процессоров:

  • CPU центральный процессор): универсальный «мозг» компьютера. ЦП превосходны в последовательной обработке и сложных логических разветвлениях, но менее эффективны для массивного параллелизма, необходимого для крупномасштабного обучения ИИ.
  • GPU графический процессор): промышленный стандарт для обучения и вывода. Ведущие производители, такие как NVIDIA используют программные экосистемы, такие как CUDA CUDA , чтобы разработчики могли GPU программировать GPU для вычислений общего назначения.
  • TPU Tensor ): специализированная интегральная схема (ASIC), разработанная специально для машинного обучения нейронных сетей. Хотя они очень эффективны для определенных tensor , они менее универсальны, чем GPU, для более широких вычислительных задач.

Применение в реальном мире

Внедрение высокопроизводительных графических процессоров стимулировало инновации в различных отраслях:

  • Автономные транспортные средства: Автомобили с автономным управлением должны каждую секунду обрабатывать гигабайты данных с камер, радаров и датчиков LiDAR. Графические процессоры обеспечивают вычисления в реальном времени, позволяя бортовому компьютеру транспортного средства запускать модели обнаружения объектов, которые мгновенно идентифицируют пешеходов, дорожные знаки и препятствия
  • Анализ медицинских изображений: В здравоохранении графические процессоры ускоряют обработку сканов высокого разрешения, таких как МРТ и КТ. Они позволяют сложным алгоритмам сегментации изображений точно определять очертания опухолей или органов, помогая радиологам ставить более быстрые и точные диагнозы, не полагаясь исключительно на визуальный осмотр.

Обучение с использованием графических процессоров

При использовании ultralytics пакета, использование GPU простым и настоятельно рекомендуется для эффективной работы. Библиотека поддерживает автоматическое обнаружение устройств, но пользователи также могут явно указать устройство.

Следующий пример демонстрирует, как обучить модель YOLO26 на первом доступном GPU:

from ultralytics import YOLO

# Load the YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the first available GPU (device=0)
# This significantly accelerates training compared to CPU usage
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, device=0)

Развертывание и оптимизация

Помимо обучения, графические процессоры играют важную роль в развертывании моделей. Для максимальной эффективности во время вывода модели часто конвертируются в оптимизированные форматы, такие как TensorRT, которые реструктурируют нейронную сеть для идеального соответствия конкретной GPU , сокращая задержку. Для разработчиков, не имеющих доступа к высокопроизводительному локальному оборудованию, Ultralytics предлагает облачные решения для управления наборами данных и обучения моделей на мощных удаленных GPU . Эта доступность стимулирует инновации в Edge AI, позволяя развертывать сложные задачи компьютерного зрения (CV) могут быть развернуты на более компактных и энергоэффективных устройствах в полевых условиях.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас