Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Half-Precision

Узнай, как половинная точность (FP16) ускоряет работу ИИ. Открой для себя способы оптимизации Ultralytics YOLO26 для более быстрого вывода и уменьшения использования памяти на GPU и периферийных устройствах.

Половинная точность, часто обозначаемая как FP16, — это формат данных с плавающей запятой, который занимает 16 бит компьютерной памяти, в отличие от стандартного формата одинарной точности (FP32), использующего 32 бита. В контексте искусственного интеллекта и машинного обучения половинная точность является критически важным методом оптимизации, используемым для ускорения обучения моделей и инференса при значительном снижении потребления памяти. Храня числовые значения — например, веса модели и градиенты нейронной сети — с использованием меньшего количества бит, ты можешь размещать более крупные модели на графических процессорах GPU или запускать существующие модели гораздо быстрее. Этот прирост эффективности необходим для развертывания современных сложных архитектур, таких как YOLO26, на устройствах с ограниченными ресурсами без существенного ущерба для точности.

Link to this sectionМеханика форматов с плавающей запятой#

Чтобы понять половинную точность, полезно сравнить её с полной точностью. Стандартное 32-битное число с плавающей запятой (FP32) выделяет больше бит на экспоненту и мантиссу, обеспечивая очень широкий динамический диапазон и высокую числовую точность. Однако модели глубокого обучения печально известны своей устойчивостью к небольшим числовым ошибкам. Нейронные сети часто могут эффективно обучаться даже при уменьшенном динамическом диапазоне и гранулярности, которые предлагает 16-битный формат.

Переход на половинную точность сокращает требования к пропускной способности памяти вдвое. Это позволяет использовать большие размеры пакетов (batch sizes) во время обучения, что может стабилизировать обновление градиентов и ускорить процесс обучения в целом. Современные аппаратные ускорители, такие как Tensor Cores от NVIDIA, специально оптимизированы для выполнения матричных умножений в FP16 на значительно более высоких скоростях, чем в FP32.

Link to this sectionКлючевые преимущества в рабочих процессах ИИ#

Принятие половинной точности предлагает несколько ощутимых преимуществ для специалистов по ИИ:

  • Снижение объема памяти: Моделям требуется вдвое меньше VRAM (видеопамяти), что позволяет тебе обучать более крупные сети или использовать обучающие данные с более высоким разрешением на том же оборудовании.
  • Более быстрый инференс: Для приложений реального времени, таких как автономные транспортные средства или видеоаналитика, FP16 может удвоить пропускную способность (кадров в секунду), сокращая задержку инференса.
  • Энергоэффективность: Обработка меньшего количества бит требует меньше энергии, что критически важно для периферийного ИИ (edge AI) и мобильных телефонов, где время автономной работы является ограничением.
  • Обучение со смешанной точностью: Многие современные фреймворки используют смешанную точность, при которой модель хранит основную копию весов в FP32 для стабильности, но выполняет тяжелые вычисления в FP16. Это дает «лучшее из обоих миров» — скорость и стабильность сходимости.

Link to this sectionРеальные приложения#

Половинная точность повсеместно встречается в производственных системах ИИ. Вот два конкретных примера:

  1. Обнаружение объектов в реальном времени на периферийных устройствах: Представь систему камер видеонаблюдения, работающую на Ultralytics YOLO26 для обнаружения злоумышленников. Развертывание модели в FP16 позволяет ей плавно работать на встроенном чипе, таком как NVIDIA Jetson или Raspberry Pi AI Kit. Сниженная вычислительная нагрузка гарантирует, что система сможет обрабатывать видеопотоки в режиме инференса в реальном времени без задержек, что жизненно важно для своевременных уведомлений.

  2. Развертывание больших языковых моделей (LLM): Генеративные модели ИИ, такие как GPT-4 или варианты Llama, имеют миллиарды параметров. Загрузка этих моделей с полной точностью (FP32) потребовала бы огромного количества серверной памяти, что часто экономически нецелесообразно. Преобразуя эти модели в FP16 (или даже в более низкие форматы), облачные провайдеры могут предоставлять фундаментальные модели тысячам пользователей одновременно, делая такие сервисы, как чат-боты и автоматическая генерация контента, экономически жизнеспособными.

Link to this sectionПоловинная точность против квантования#

Хотя оба метода направлены на уменьшение размера модели, важно различать «половинную точность» и квантование модели.

  • Половинная точность (FP16): Уменьшает разрядность с 32 до 16, но сохраняет данные как числа с плавающей запятой. Она сохраняет разумный динамический диапазон и часто является выбором по умолчанию для обучения на GPU и инференса.
  • Квантование (INT8): Преобразует числа с плавающей запятой в целые числа (обычно 8-битные). Это обеспечивает еще большую скорость и экономию памяти, но иногда может привести к более заметному падению точности, если не сделать это осторожно (например, с помощью квантования с учетом обучения (QAT)). FP16, как правило, безопаснее для сохранения производительности модели, тогда как INT8 используется для экстремальной оптимизации.

Link to this sectionРеализация половинной точности с Ultralytics#

Библиотека ultralytics делает использование половинной точности очень простым. Во время предсказания модель может автоматически переключаться на половинную точность, если оборудование поддерживает её, либо это можно запросить явно.

Вот пример на Python, демонстрирующий, как загрузить модель YOLO26 и выполнить инференс с использованием половинной точности. Обрати внимание, что запуск с half=True обычно требует наличия GPU с поддержкой CUDA.

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available, as FP16 is primarily for GPU acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on an image with half-precision enabled
# The 'half=True' argument tells the engine to use FP16
results = model.predict("https://ultralytics.com/images/bus.jpg", device=device, half=True)

# Print the device and precision status
print(f"Inference device: {results[0].orig_img.shape}, Speed: {results[0].speed}")

Для пользователей, управляющих наборами данных и конвейерами обучения, Ultralytics Platform автоматически выполняет многие из этих оптимизаций в облаке, упрощая переход от разметки до развертывания оптимизированной модели.

Link to this sectionДополнительные материалы и ресурсы#

Чтобы узнать больше о числовых форматах и их влиянии на ИИ, ознакомься с документацией NVIDIA по производительности глубокого обучения в отношении Tensor Cores. Для более широкого понимания того, как эти оптимизации вписываются в жизненный цикл разработки, прочитай о машинном обучении (MLOps).

Кроме того, те, кто интересуется компромиссами между различными стратегиями оптимизации, могут изучить прунинг, который удаляет соединения, а не снижает разрядность, или ознакомиться со стандартом IEEE для арифметики с плавающей запятой (IEEE 754) для получения технических спецификаций цифровой арифметики. Понимание этих основ помогает принимать обоснованные решения при экспорте моделей в такие форматы, как ONNX или TensorRT, для производственных сред.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения