Model Weights

Узнай, как веса модели выступают в роли знаний ИИ. Изучи, как Ultralytics YOLO26 использует оптимизированные веса для более быстрого и точного обучения и инференса.

Веса модели — это обучаемые параметры внутри модели машинного обучения, которые преобразуют входные данные в предсказанные результаты. В нейронной сети эти веса представляют собой силу связей между нейронами в разных слоях. Когда модель инициализируется, эти веса обычно устанавливаются в случайные небольшие значения, что означает, что модель «ничего не знает». Посредством процесса, называемого обучением, модель итеративно корректирует эти веса на основе совершаемых ею ошибок, постепенно учась распознавать закономерности, признаки и взаимосвязи внутри данных. Ты можешь представить веса модели как «память» или «знания» ИИ; они хранят то, что система изучила из своих обучающих данных.

Link to this sectionРоль весов в обучении#

Основная цель обучения нейронной сети — найти оптимальный набор весов модели, который минимизирует ошибку между предсказаниями модели и фактическими истинными данными. Этот процесс включает в себя пропуск данных через сеть — шаг, известный как прямой проход — и затем вычисление значения потерь с использованием специфической функции потерь. Если предсказание неверно, алгоритм оптимизации, такой как стохастический градиентный спуск (SGD) или более новый оптимизатор Muon, используемый в YOLO26, вычисляет, какой вклад каждый вес внес в ошибку.

Посредством метода, называемого обратным распространением ошибки, алгоритм слегка обновляет веса, чтобы уменьшить ошибку в следующий раз. Этот цикл повторяется тысячи или миллионы раз, пока веса модели не стабилизируются и система не достигнет высокой точности. Как только обучение завершено, веса «замораживаются» и сохраняются, что позволяет развернуть модель для вывода на новых, ранее не виденных данных.

Link to this sectionВеса модели против смещений#

Важно различать веса и смещения, так как они работают вместе, но служат разным целям. В то время как веса модели определяют силу и направление связи между нейронами (контролируя наклон активации), смещения позволяют сдвигать функцию активации влево или вправо. Этот сдвиг гарантирует, что модель может лучше соответствовать данным, даже когда все входные признаки равны нулю. Вместе веса и смещения формируют обучаемые параметры, которые определяют поведение таких архитектур, как сверточные нейронные сети (CNN).

Link to this sectionРеальные приложения#

Веса модели — это основной компонент, который позволяет системам ИИ функционировать в различных отраслях. Вот два конкретных примера того, как они применяются:

Компьютерное зрение в ритейле: В системе умного супермаркета модель, такая как YOLO26, использует свои обученные веса для идентификации продуктов на полке. Веса «изучили» визуальные признаки, такие как форма коробки с хлопьями или цвет банки газировки, что позволяет системе эффективно обнаруживать товары, управлять запасами и даже облегчать процессы автоматизированной оплаты.
Анализ медицинских изображений: В здравоохранении модели глубокого обучения используют специализированные веса для анализа рентгеновских снимков или МРТ. Например, модель, обученная для обнаружения опухолей, использует свои веса, чтобы различать здоровую ткань и потенциальные аномалии. Эти веса фиксируют сложные нелинейные закономерности в данных пикселей, которые могут быть незаметны для человеческого глаза, помогая радиологам ставить более быстрые диагнозы.

Link to this sectionСохранение и загрузка весов#

На практике работа с весами модели включает сохранение обученных параметров в файл и их последующую загрузку для предсказания или тонкой настройки. В экосистеме Ultralytics они обычно хранятся в виде файлов .pt (PyTorch).

Вот простой пример того, как загрузить предварительно обученные веса в модель YOLO и запустить предсказание:

from ultralytics import YOLO

# Load a model with pre-trained weights (e.g., YOLO26n)
model = YOLO("yolo26n.pt")

# Run inference on an image using the loaded weights
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")

Link to this sectionПеренос обучения и тонкая настройка#

Один из самых мощных аспектов весов модели — их переносимость. Вместо того чтобы обучать модель с нуля, что требует огромных наборов данных и значительных вычислительных мощностей, разработчики часто используют перенос обучения. Это подразумевает использование модели с весами, предварительно обученными на большом наборе данных, таком как COCO или ImageNet, и их адаптацию под конкретную задачу.

Например, ты можешь взять веса из общего детектора объектов и донастроить их на меньшем наборе данных солнечных панелей. Поскольку предварительно обученные веса уже понимают края, формы и текстуры, модель сходится намного быстрее и требует меньше размеченных данных. Инструменты, такие как Ultralytics Platform, упрощают этот процесс, позволяя командам управлять наборами данных, обучать модели в облаке и легко развертывать оптимизированные веса на периферийных устройствах.

Link to this sectionСжатие и оптимизация#

Современные исследования в области ИИ часто фокусируются на уменьшении размера файла весов модели без потери производительности, что известно как квантование модели. Уменьшая точность весов (например, с 32-битных чисел с плавающей запятой до 8-битных целых чисел), разработчики могут значительно снизить использование памяти и повысить скорость вывода. Это критически важно для развертывания моделей на устройствах с ограниченными ресурсами, таких как мобильные телефоны или устройства Raspberry Pi. Кроме того, такие методы, как прунинг, удаляют веса, которые вносят малый вклад в результат, что еще больше оптимизирует модель для приложений реального времени.

Explore solutions

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Model Weights

Link to this sectionРоль весов в обучении#

Link to this sectionВеса модели против смещений#

Link to this sectionРеальные приложения#

Link to this sectionСохранение и загрузка весов#

Link to this sectionПеренос обучения и тонкая настройка#

Link to this sectionСжатие и оптимизация#

Explore solutions

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

Давай строить будущее ИИ вместе!