Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Изучаем, почему Ultralytics проще внедрить в производство!

Узнайте, как Ultralytics объединяет исследования и производство благодаря передовой конструкции, которая упрощает развертывание и интеграцию.

Ultralytics , наша новейшая модель компьютерного зрения, знаменует собой шаг вперед в упрощении внедрения решений компьютерного зрения в реальном времени. Другими словами, она разработана для более плавного перехода от экспериментов к системам, которые постоянно работают на реальном оборудовании.

Компьютерное зрение в настоящее время используется во многих реальных приложениях, включая производство, робототехнику, розничную торговлю и инфраструктуру. По мере перехода этих систем от тестирования к повседневному использованию, акцент смещается с производительности отдельных моделей на то, насколько хорошо модель вписывается в более крупную программную систему. Такие факторы, как надежность, эффективность и простота интеграции, столь же важны, как и точность.

Это изменение имеет важные последствия для того, как разрабатываются и оцениваются модели компьютерного зрения. Успех в производстве зависит не только от того, что может detect модель, но и от того, насколько легко ее можно интегрировать, развернуть и поддерживать в течение длительного времени.

YOLO26 был создан с учетом этих практических потребностей. Благодаря фокусу на сквозном выводе, приоритете производительности на периферии и упрощенной интеграции, он снижает сложность всего процесса развертывания. 

В этой статье мы рассмотрим, как Ultralytics помогает преодолеть разрыв между исследованиями и производством, и почему его функции упрощают внедрение систем компьютерного зрения в реальном времени в реальные приложения. Приступим!

Разрыв между исследованиями и производством в области компьютерного зрения

По мере того как компьютерное зрение становится все более широко используемым, многие команды выходят за рамки исследований и начинают внедрять модели в реальные приложения. Этот следующий шаг к производству часто выявляет проблемы, которые не были заметны во время экспериментов.

В исследовательских условиях модели обычно тестируются в контролируемой среде с использованием фиксированных наборов данных. Эти тесты полезны для измерения точности, но они не полностью отражают то, как модель будет вести себя после внедрения. В производстве системы компьютерного зрения должны обрабатывать данные в реальном времени, работать непрерывно и функционировать на реальном оборудовании вместе с другим программным обеспечением.

Как только модель становится частью производственной системы, факторы, выходящие за рамки точности, приобретают большее значение. Конвейеры инференса могут включать дополнительные этапы; производительность может варьироваться в зависимости от устройств, а системы должны работать стабильно в течение длительного времени. Эти практические соображения влияют на то, насколько легко модель может быть интегрирована и поддерживаться по мере масштабирования приложений.

В связи с этими факторами переход от исследований к производству часто связан не столько с улучшением результатов моделирования, сколько с упрощением внедрения и эксплуатации. Модели, которые проще интегрировать, эффективно работают на целевом оборудовании и ведут себя предсказуемо, как правило, более плавно переходят в производство.

Ultralytics был создан с учетом этого перехода. Упрощение процесса развертывания помогает командам более эффективно переносить модели компьютерного зрения из экспериментальной среды в реальную производственную среду.

Сквозное выведение упрощает развертывание Ultralytics

Одной из ключевых причин, по которой Ultralytics более практичен в развертывании, является его сквозной дизайн инференса. Проще говоря, это означает, что модель разработана таким образом, чтобы напрямую генерировать окончательные прогнозы, не полагаясь на дополнительные этапы постобработки за пределами самой модели.

Во многих традиционных системах компьютерного зрения вывод не прекращается после завершения работы модели. Вместо этого модель выдает большое количество промежуточных прогнозов, которые необходимо отфильтровать и уточнить, прежде чем их можно будет использовать. 

Эти дополнительные шаги часто выполняются на отдельном этапе постобработки, называемом «немаксимальное подавление» (NMS), что усложняет работу всей системы. В производственных средах эта сложность может стать проблемой. 

Этапы постобработки могут увеличить задержку, вести себя по-разному на разных аппаратных платформах и требовать дополнительных работ по интеграции. Они также добавляют больше компонентов, которые необходимо тестировать, обслуживать и поддерживать в рабочем состоянии по мере расширения систем.

YOLO26 использует другой подход. Решение проблемы дублирующихся прогнозов и получение окончательных результатов в рамках модели сокращает количество шагов, необходимых в процессе вывода. Это упрощает развертывание, поскольку уменьшается количество внешней логики, которую необходимо управлять, и сокращается вероятность возникновения несоответствий между средами.

Для команд, развертывающих системы технического зрения, эта комплексная конструкцияNMS помогает оптимизировать интеграцию. Модель ведет себя более предсказуемо после развертывания, а экспортированные модели, то есть версии, подготовленные для запуска вне среды обучения на целевом оборудовании, являются более автономными. 

В результате то, что тестируется на этапе разработки, более точно соответствует тому, что работает в производственной среде. Это упрощает интеграцию Ultralytics в реальные программные системы и упрощает масштабирование.

Создан для транспортировки: производительность и возможности обучения, снижающие риски

Помимо сквозного вывода, Ultralytics включает в себя набор параметров производительности и обучения, разработанных для того, чтобы сделать внедрение в производство более предсказуемым. 

Вот некоторые из ключевых функций, которые упрощают доставку и эксплуатацию Ultralytics в производстве:

  • Производительность на периферии: Ultralytics оптимизирован для эффективной работы на центральных процессорах (CPU) и периферийном оборудовании, а не только на графических процессорах (GPU). По сравнению с Ultralytics YOLO11, модель YOLO26 nano обеспечивает до 43 % более быстрое CPU , что делает ее более подходящей для производственных сред, где вычислительные ресурсы могут быть ограничены.
  • Более стабильное обучение: YOLO26 использует метод обучения под названием «Прогрессивное уравновешивание потерь» (Progressive Loss Balancing), который регулирует процесс обучения модели с течением времени. На ранних этапах обучения модель получает больше указаний, чтобы она могла выучить стабильные шаблоны. По мере продолжения обучения количество указаний постепенно сокращается, чтобы модель вела себя так же, как при использовании в производственной среде. Такой подход помогает обучению проходить более плавно и дает более стабильные результаты при обучении или переобучении моделей.
  • Улучшенное обнаружение мелких объектов: также используется метод обучения под названием Small-Target-Aware Label Assignment (STAL), благодаря которому модель не пропускает очень мелкие объекты во время обучения. Это повышает надежность в сценариях, где объекты могут быть мелкими или находиться на большом расстоянии.
  • Новый оптимизатор: в новой модели также представлен оптимизатор обучения под названием MuSGD, разработанный для повышения стабильности и согласованности обучения. MuSGD сочетает в себе традиционный оптимизатор стохастического градиентного спуска (SGD) с идеями, вдохновленными последними достижениями в области обучения больших языковых моделей. Вместо того чтобы сосредоточиться только на ускорении обучения, он помогает моделям более плавно сходиться и вести себя более предсказуемо при переобучении, тонкой настройке или обновлении для производственного использования.
Рис. 1. YOLO26n обеспечивает на 43 % более быстрое CPU по сравнению с YOLO11n (Источник)

В целом, эти инновации помогают снизить риски и сложность внедрения систем компьютерного зрения в производство. Благодаря сочетанию высокой производительности на периферии с более стабильным обучением и предсказуемым поведением модели, Ultralytics упрощает для команд переход от разработки к реальному внедрению с уверенностью в успехе.

Ultralytics упрощает интеграционные конвейеры

Развертывание модели компьютерного зрения редко сводится только к самой модели. В производственной среде команды должны обучать модели, выполнять инференцию, контролировать производительность и экспортировать модели в форматы, которые работают на разных платформах и аппаратном обеспечении. Каждый дополнительный инструмент или настраиваемый скрипт в этом конвейере увеличивает сложность и риск сбоев.

Ultralytics разработан для упрощения этого процесса путем объединения всех этапов в единый последовательный рабочий процесс. Используя одну библиотеку, команды могут обучать модели, такие как YOLO26, выполнять прогнозы, проверять результаты и экспортировать модели для развертывания без смены инструментов или перезаписи кода интеграции. 

Он также поддерживает широкий спектр интеграций на протяжении всего жизненного цикла, от обучения и оценки до экспорта и развертывания на различных аппаратных целях. Этот унифицированный подход имеет большое значение в производственных средах.

Рис. 2. Обзор типов интеграций, поддерживаемых Ultralytics Источник)

Те же команды и интерфейсы, которые использовались во время экспериментов, применяются и при развертывании, что снижает трение между исследовательскими, инженерными и операционными командами. Экспорт моделей также становится более предсказуемым, поскольку модели YOLO26 можно напрямую конвертировать в форматы, такие как ONNX, TensorRT, CoreML, OpenVINO и другие, которые широко используются в производственных системах.

Минимизируя количество кода и работу по индивидуальной интеграции, Ultralytics помогает командам сосредоточиться на создании надежных приложений, а не на обслуживании сложных конвейеров. Это упрощает масштабирование развертываний, обновление моделей с течением времени и обеспечение согласованности поведения в средах разработки и производства.

Реальные применения Ultralytics

Далее давайте посмотрим, как Ultralytics можно использовать в реальных приложениях, требующих надежных и готовых к производству возможностей компьютерного зрения.

Системы машинного зрения для роботов-транспортёров с Ultralytics

Роботизированные системы зависят от быстрого и надежного восприятия, чтобы работать безопасно и эффективно. Будь то автономный мобильный робот, перемещающийся по складу, или роботизированная рука, обрабатывающая объекты на линии, модели зрения должны обеспечивать стабильные результаты с минимальной задержкой. 

Ultralytics может detect , распознавать объекты и отслеживать присутствие людей непосредственно на робототехническом оборудовании. Его комплексная конструкция упрощает интеграцию в программное обеспечение для управления роботами, облегчая внедрение функций машинного зрения, которые работают непрерывно в реальных условиях.

Внедрение Ultralytics на производственных площадях

На производственных площадках компьютерное зрение обычно используется для мониторинга оборудования, проверки продукции и обеспечения безопасности производственных процессов. YOLO26 может быть установлено на локальном промышленном оборудовании для detect , проверки этапов сборки или track механических компонентов в режиме реального времени. 

Его способность эффективно работать на периферийных устройствах делает его подходящим для производственных линий, где системы должны работать непрерывно, с низкой задержкой и минимальными накладными расходами на инфраструктуру.

Рис. 3. Использование YOLO отслеживания движения привода.

Запуск Ultralytics на дронах и удаленных системах

Дроны и дистанционные системы часто работают с ограниченной мощностью и ненадежной связью. YOLO26 может обрабатывать визуальные данные непосредственно на устройстве, что позволяет выполнять такие задачи, как осмотр, съемка или мониторинг во время полета. Анализируя изображения локально, системы могут реагировать в режиме реального времени и сокращать необходимость передачи больших объемов данных в центральное хранилище.

Масштабирование систем видеонаблюдения для умных городов с помощью Ultralytics

Представьте себе город, в котором камеры установлены на перекрестках, в общественных парках и транспортных узлах. В каждом месте может использоваться различное оборудование и действовать в разных условиях, но система технического зрения должна работать стабильно. 

Ultralytics может помочь в анализе этих видеопотоков для таких задач, как мониторинг дорожного движения, обнаружение пешеходов или анализ общественных пространств. Его предсказуемое поведение при развертывании и поддержка нескольких аппаратных платформ упрощают внедрение, обновление и обслуживание систем технического зрения в крупных распределенных городских средах.

Рис. 4. Обнаружение человека, собаки и скамейки в городе с помощью YOLO26.

Почему упрощение доставки меняет бизнес-модель Vision AI 

Для многих организаций самой большой проблемой при использовании Vision AI является не создание модели, которая работает в демо-версии, а преобразование этой работы в систему, которая надежно функционирует в производственной среде. 

Развертывание часто требует значительных инженерных усилий, постоянного обслуживания и координации между командами, что может замедлить реализацию проектов или ограничить их влияние. Когда модели просты в доставке, это меняет бизнес-уравнение. 

Более быстрое развертывание сокращает время окупаемости. Более простая интеграция снижает инженерные и эксплуатационные расходы. Более предсказуемое поведение в различных средах снижает риски и делает долгосрочное планирование практичным.

Ultralytics разработан с учетом этих факторов. Упрощение развертывания и поддержка стабильной работы в производственной среде помогают организациям перейти от экспериментов с Vision AI к повседневному использованию. Для руководителей предприятий это делает компьютерное зрение более практичной и надежной инвестицией, а не высокорискованным научным проектом.

Основные выводы

Ultralytics создан для устранения разрыва между исследованиями и производством за счет упрощения внедрения и обслуживания компьютерного зрения в реальном времени. Его комплексная конструкция и первоклассная производительность снижают сложность, которая часто замедляет проекты Vision AI. Это позволяет организациям действовать быстрее и быстрее получать прибыль.

Присоединяйтесь к нашему сообществу и изучите наш репозиторий GitHub, чтобы узнать больше об ИИ. Посетите наши страницы с решениями, чтобы узнать об ИИ в розничной торговле и компьютерном зрении в сельском хозяйстве. Ознакомьтесь с нашими вариантами лицензирования и начните создавать решения с помощью компьютерного зрения уже сегодня!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно