GPU (Graphics Processing Unit)
Узнай, как GPU ускоряют ИИ и глубокое обучение. Открой для себя мощь параллельных вычислений для обучения моделей Ultralytics YOLO26 и оптимизации вывода в реальном времени.
Графический процессор (GPU) — это специализированная электронная схема, изначально разработанная для ускорения обработки и создания изображений во фрейм-буфере для вывода на дисплей. Хотя их корни уходят в рендеринг компьютерной графики для игр и профессиональной визуализации, GPU превратились в фундаментальный двигатель современного искусственного интеллекта (ИИ). В отличие от стандартного процессора, который использует несколько мощных ядер для последовательного выполнения задач, архитектура GPU состоит из тысяч более мелких и эффективных ядер, предназначенных для одновременного выполнения множества задач. Эта способность, известная как параллельные вычисления, делает их исключительно эффективными для массовых матричных и векторных операций, лежащих в основе глубокого обучения (DL) и сложных нейронных сетей (NN).
Link to this sectionУскорение рабочих нагрузок ИИ#
Основная причина, по которой GPU незаменимы для машинного обучения (ML), — это их способность выполнять высокоскоростное матричное умножение. Фреймворки глубокого обучения, такие как PyTorch и TensorFlow, специально оптимизированы для использования этого аппаратного ускорения. Это приводит к значительному сокращению времени обучения моделей, зачастую превращая недели вычислений на стандартном процессоре в часы на GPU. Вычислительная пропускная способность этих устройств обычно измеряется в FLOPS (количество операций с плавающей запятой в секунду) — ключевом показателе для оценки способности оборудования справляться с жесткими требованиями современных моделей, таких как YOLO26.
Link to this sectionАппаратные различия: GPU против CPU против TPU#
Чтобы понять ландшафт оборудования, полезно различать GPU и другие типы процессоров:
- CPU (Центральный процессор): «Мозг» компьютера общего назначения. CPU отлично справляются с последовательной обработкой и сложным логическим ветвлением, но менее эффективны для массового параллелизма, необходимого для крупномасштабного обучения ИИ.
- GPU (Графический процессор): Отраслевой стандарт для обучения и вывода. Ведущие производители, такие как NVIDIA, используют программные экосистемы, такие как CUDA, чтобы позволить разработчикам программировать GPU напрямую для вычислений общего назначения.
- TPU (Тензорный процессор): Специализированная интегральная схема (ASIC), разработанная специально для машинного обучения на нейронных сетях. Хотя они очень эффективны для специфических тензорных операций, они менее универсальны, чем GPU, для более широкого спектра вычислительных задач.
Link to this sectionРеальные приложения#
Внедрение высокопроизводительных GPU способствовало инновациям в самых разных отраслях:
- Автономные транспортные средства: Беспилотные автомобили должны каждую секунду обрабатывать гигабайты данных с камер, радаров и лидаров. GPU обеспечивают вывод в реальном времени, позволяя бортовому компьютеру автомобиля запускать модели обнаружения объектов, которые мгновенно идентифицируют пешеходов, дорожные знаки и препятствия.
- Анализ медицинских изображений: В здравоохранении GPU ускоряют обработку изображений высокого разрешения, таких как МРТ и КТ. Они позволяют использовать сложные алгоритмы сегментации изображений для точного выделения опухолей или органов, помогая радиологам ставить более быстрые и точные диагнозы без необходимости полагаться исключительно на ручной осмотр.
Link to this sectionОбучение с использованием GPU#
При использовании пакета ultralytics задействование GPU является простым и крайне рекомендуемым для эффективных рабочих процессов. Библиотека поддерживает автоматическое обнаружение устройства, но ты также можешь явно указать устройство.
Следующий пример показывает, как обучить модель YOLO26 на первом доступном GPU:
from ultralytics import YOLO
# Load the YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the first available GPU (device=0)
# This significantly accelerates training compared to CPU usage
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, device=0)Link to this sectionРазвертывание и оптимизация#
Помимо обучения, GPU играют важнейшую роль в развертывании моделей. Для достижения максимальной эффективности при выполнении вывода модели часто преобразуются в оптимизированные форматы, такие как TensorRT, который реструктурирует нейронную сеть так, чтобы она идеально соответствовала архитектуре конкретного GPU, уменьшая задержки. Для разработчиков, не имеющих доступа к мощному локальному оборудованию, платформа Ultralytics предлагает облачные решения для управления наборами данных и обучения моделей на мощных удаленных GPU-кластерах. Такая доступность стимулирует инновации в области периферийного ИИ (Edge AI), позволяя развертывать сложные задачи компьютерного зрения (CV) на небольших энергоэффективных устройствах непосредственно на объектах.






