Глоссарий

Масштабируемость

Изучите важность масштабируемости в искусственном интеллекте. Узнайте, как Ultralytics и Ultralytics позволяют эффективно развертывать высокопроизводительные модели.

Масштабируемость — это способность системы, сети или процесса обрабатывать растущий объем работы за счет добавления ресурсов. В контексте искусственного интеллекта (ИИ) и машинного обучения (МО) масштабируемость описывает способность модели или инфраструктуры поддерживать уровень производительности при увеличении спроса. Этот спрос обычно проявляется в виде более крупных наборов данных во время обучения, более высокого пользовательского трафика во время вывода или увеличения сложности вычислительных задач. Масштабируемая архитектура позволяет осуществлять беспрепятственное расширение — будь то развертывание модели компьютерного зрения на одном встроенном устройстве или обслуживание миллионов запросов API через облачные кластеры — обеспечивая низкую задержку вывода даже при высокой нагрузке.

Важность масштабируемости в искусственном интеллекте

Проектирование с учетом масштабируемости является важным компонентом успешных операций машинного обучения (MLOps). Модель, которая отлично работает в контролируемой исследовательской среде, может выйти из строя при воздействии высокоскоростных потоков данных, встречающихся в производственной среде. Для эффективного управления большими данными требуются системы, которые могут масштабироваться горизонтально (добавление дополнительных машин в кластер) или вертикально (добавление дополнительной мощности, такой как ОЗУ или графические процессоры, к существующим машинам).

Ключевые преимущества масштабируемых систем искусственного интеллекта включают:

Надежность: масштабируемые системы обеспечивают постоянную работоспособность сервисов во время неожиданных всплесков трафика, предотвращая сбои в работе критически важных приложений.
Экономическая эффективность: динамическое масштабирование позволяет сокращать ресурсы в периоды низкой загрузки, что часто управляется облачными вычислительными платформами, такими как AWS или Google .
Готовность к будущему: масштабируемая инфраструктура поддерживает новые, более сложные алгоритмы, такие как трансформеры зрения (ViT), без необходимости полной переработки аппаратной экосистемы.

Стратегии достижения масштабируемости

Создание масштабируемых ИИ-решений предполагает оптимизацию как архитектуры модели, так и инфраструктуры развертывания.

Распределенное обучение: когда наборы данных для обучения становятся слишком большими для одного процессора, распределенное обучение разделяет рабочую нагрузку между несколькими графическими процессорами (GPU). Такие фреймворки, как PyTorch , позволяют разработчикам параллелизировать вычисления, значительно сокращая время, необходимое для обучения базовых моделей. Инструменты , такие как Ultralytics , упрощают этот процесс, автоматически управляя облачными ресурсами для обучения.
Эффективные архитектуры моделей: выбор правильной архитектуры модели имеет решающее значение для пропускной способности. Новейшая модель Ultralytics разработана так, чтобы быть меньше и быстрее своих предшественников, что делает ее изначально масштабируемой на различном оборудовании, от периферийных устройств искусственного интеллекта до массивных серверных ферм.
Контейнеризация и оркестрация: упаковка приложений с помощью Docker гарантирует их стабильную работу в различных средах. Для управления большими кластерами контейнеров Kubernetes автоматизирует развертывание, масштабирование и управление контейнерными приложениями.
Оптимизация модели: такие методы, как квантование и обрезка модели, уменьшают объем памяти и вычислительные затраты модели. Инструменты, такие как NVIDIA TensorRT могут еще больше ускорить скорость вывода, обеспечивая более высокую пропускную способность на существующем оборудовании.

Пример кода: масштабируемое пакетное вычисление

Одним из эффективных методов повышения масштабируемости во время вывода является обработка входных данных пакетно, а не последовательно. Это позволяет максимально GPU и повысить общую пропускную способность.

from ultralytics import YOLO

# Load a scalable YOLO26 model (smaller 'n' version for speed)
model = YOLO("yolo26n.pt")

# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference on the batch
results = model(batch_images)

# Print the number of detections for the first image
print(f"Detected {len(results[0].boxes)} objects in the first image.")

Применение в реальном мире

Масштабируемость позволяет технологиям искусственного интеллекта перейти от теоретических исследований к глобальным промышленным инструментам.

Интеллектуальное производство: в области искусственного интеллекта в производстве автоматизированные системы контроля должны анализировать тысячи компонентов в час на высокоскоростных сборочных линиях. Масштабируемая система обнаружения объектов гарантирует, что при увеличении скорости производства процесс контроля качества сохраняет высокую точность, не становясь узким местом.
Рекомендательные системы для розничной торговли: крупные платформы электронной коммерции используют рекомендательные системы, чтобы мгновенно предоставлять миллионы персонализированных предложений по продуктам. Масштабируемая инфраструктура позволяет этим платформам обрабатывать массовые события, такие как Черная пятница, когда трафик может увеличиваться в 100 раз, путем динамического предоставления дополнительных серверных узлов через Microsoft или аналогичных поставщиков.