Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Model Quantization

Узнай, как квантование моделей оптимизирует Ultralytics YOLO26 для граничного ИИ. Открой для себя способы сокращения памяти, снижения задержки и экспорта INT8-моделей для ускоренного инференса.

Квантование моделей — это сложный метод оптимизации моделей, используемый для снижения вычислительных затрат и требований к памяти при запуске моделей глубокого обучения. В стандартных рабочих процессах обучения нейронные сети обычно хранят параметры (веса и смещения) и карты активации с использованием 32-битных чисел с плавающей запятой (FP32). Хотя такая высокая точность обеспечивает корректные вычисления во время обучения, она часто избыточна для инференса. Квантование преобразует эти значения в форматы с более низкой точностью, такие как 16-битные числа с плавающей запятой (FP16) или 8-битные целые числа (INT8), что эффективно уменьшает размер модели и ускоряет выполнение без существенной потери точности.

Link to this sectionПочему квантование важно#

Основная причина для квантования — необходимость развертывания мощного ИИ на оборудовании с ограниченными ресурсами. По мере того как модели компьютерного зрения, такие как YOLO26, становятся сложнее, растут и их вычислительные потребности. Квантование решает три критические проблемы:

  • Объем занимаемой памяти: За счет уменьшения разрядности весов (например, с 32 до 8 бит) требования к памяти модели сокращаются до 4 раз. Это жизненно важно для мобильных приложений, где размер приложения ограничен.
  • Задержка инференса: Операции с более низкой точностью менее затратны с вычислительной точки зрения. Современные процессоры, особенно те, что оснащены специализированными нейронными процессорами (NPU), могут выполнять операции INT8 намного быстрее, чем FP32, что значительно снижает задержку инференса.
  • Энергопотребление: Передача меньшего объема данных через память и выполнение более простых арифметических операций потребляют меньше энергии, продлевая срок службы батареи портативных устройств и автономных транспортных средств.

Link to this sectionСравнение со смежными концепциями#

Важно отличать квантование от других методов оптимизации, так как они модифицируют модель по-разному:

  • Квантование против прунинга: В то время как квантование уменьшает размер файла за счет снижения разрядности параметров, прунинг модели (отсечение) предполагает полное удаление ненужных связей (весов) для создания разреженной сети. Прунинг меняет структуру модели, тогда как квантование изменяет представление данных.
  • Квантование против дистилляции знаний: Дистилляция знаний — это метод обучения, при котором маленькая «модель-ученик» учится имитировать большую «модель-учителя». Квантование часто применяется к модели-ученику после дистилляции для дальнейшего повышения производительности периферийного ИИ.

Link to this sectionРеальные приложения#

Квантование открывает возможности для компьютерного зрения и ИИ в различных отраслях, где эффективность имеет решающее значение.

  1. Автономные системы: В автомобильной промышленности беспилотные автомобили должны обрабатывать визуальные данные с камер и LiDAR в режиме реального времени. Квантованные модели, развернутые на движках NVIDIA TensorRT, позволяют таким автомобилям обнаруживать пешеходов и препятствия с миллисекундной задержкой, обеспечивая безопасность пассажиров.

  2. Умное сельское хозяйство: Дроны, оснащенные мультиспектральными камерами, используют квантованные модели обнаружения объектов для выявления болезней сельскохозяйственных культур или мониторинга стадий роста. Запуск этих моделей локально на встроенных системах дрона избавляет от необходимости в ненадежном сотовом соединении в отдаленных полях.

Link to this sectionРеализация квантования с Ultralytics#

Библиотека Ultralytics упрощает процесс экспорта, позволяя тебе конвертировать модели, такие как передовая YOLO26, в квантованные форматы. Платформа Ultralytics также предоставляет инструменты для беспрепятственного управления этими развертываниями.

Следующий пример демонстрирует, как экспортировать модель в TFLite с включенным квантованием INT8. Этот процесс включает этап калибровки, на котором модель анализирует выборочные данные для определения оптимального динамического диапазона квантованных значений.

from ultralytics import YOLO

# Load a standard YOLO26 model
model = YOLO("yolo26n.pt")

# Export to TFLite format with INT8 quantization
# The 'int8' argument triggers Post-Training Quantization
# 'data' provides the calibration dataset needed for mapping values
model.export(format="tflite", int8=True, data="coco8.yaml")

Оптимизированные модели часто развертываются с использованием интероперабельных стандартов, таких как ONNX, или высокопроизводительных движков инференса, таких как OpenVINO, что обеспечивает широкую совместимость с различными аппаратными экосистемами.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения