Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Мероприятия

Поведенческий ИИ делает компьютерное зрение более эффективным

Присоединяйся к нам, чтобы вспомнить ключевое выступление Дэвида Скотта на YOLO Vision 2024, посвященное анализу поведения на основе ИИ и его практическому применению в таких секторах, как животноводство.

АБАбирами Вина
4 min read
Дэвид Скотт (David Scott) представляет поведенческий ИИ на YOLO Vision 2024

В течение многих лет инновации в области компьютерного зрения были сосредоточены на таких задачах, как обнаружение объектов, то есть идентификация объектов, например собаки или автомобиля, на изображениях и видео. Эти подходы позволили внедрить приложения в таких сферах, как беспилотные транспортные средства, производство и здравоохранение.

Однако такие задачи часто сводятся лишь к тому, чтобы определить, что перед нами за объект. А что, если системы ИИ в компьютерном зрении могли бы пойти дальше? Например, вместо того чтобы просто обнаруживать собаку, система могла бы понять, что собака гонится за мячом, или что автомобиль резко тормозит, потому что дорогу переходит пешеход. Этот переход от простого распознавания к контекстуальному пониманию знаменует собой важный сдвиг в сторону более интеллектуального, контекстно-зависимого поведенческого ИИ.

На YOLO Vision 2024 (YV24), ежегодном гибридном мероприятии Ultralytics, посвященном достижениям в области искусственного интеллекта в компьютерном зрении, концепция поведенческого анализа на базе ИИ заняла центральное место во время интересного выступления Дэвида Скотта, генерального директора The Main Branch.

В своем выступлении Дэвид рассказал о переходе от базовых задач компьютерного зрения к поведенческому отслеживанию. Обладая более чем 25-летним опытом создания передовых технологических приложений, он продемонстрировал влияние этого качественного скачка. Он подчеркнул, как расшифровка паттернов и моделей поведения меняет такие отрасли, как сельское хозяйство и защита животных.

В этой статье мы пройдемся по основным моментам выступления Дэвида и разберемся, как поведенческое отслеживание делает ИИ более практичным.

Link to this sectionПонимание проблем внедрения ИИ#

Дэвид Скотт начал свою основную речь со смелой констатации фактов: «Один мой коллега часто говорит: „Наука не продается“, что немного задевает многих из нас, потому что мы действительно любим науку. ИИ — это очень круто, почему бы людям просто не купить его? Но реальность такова, что люди не хотят покупать его только потому, что мы считаем его крутым; им нужна причина для покупки».

Он продолжил и объяснил, что в его компании, The Main Branch, фокус всегда направлен на решение реальных проблем с помощью ИИ, а не просто на демонстрацию его возможностей. Многие клиенты приходят с желанием поговорить о том, как они могут использовать ИИ в принципе, но он считает такой подход ошибочным — это все равно что иметь решение без проблемы. Вместо этого они работают с клиентами, которые приносят конкретные вызовы, чтобы они могли создать решения на базе ИИ, которые действительно приносят пользу.

Дэвид Скотт на сцене YV24

Рис. 1. Дэвид Скотт на сцене YV24.

Дэвид также отметил, что их работа часто выходит за рамки простого распознавания объектов в кадре. Обнаружение того, что находится перед нами, — это лишь первый шаг. Настоящая ценность заключается в том, чтобы понять, что делать с этой информацией, и сделать ее полезной в рамках более широкой цепочки создания стоимости.

Link to this sectionТехнология поведенческого отслеживания: ключ к практичному ИИ#

Важнейший шаг к тому, чтобы сделать ИИ по-настоящему полезным, — это выход за рамки базовых задач компьютерного зрения, таких как обнаружение объектов, и использование этих данных для поведенческого отслеживания. Дэвид подчеркнул, что поведенческий ИИ фокусируется на понимании действий и паттернов, а не просто на идентификации объектов. Это делает ИИ способным распознавать значимые события и предоставлять полезные инсайты.

Он привел пример животного, катающегося по полу, что может указывать на болезнь. В то время как люди не могут наблюдать за животным круглосуточно, системы наблюдения на базе ИИ с функциями поведенческого отслеживания могут. Такие решения могут непрерывно отслеживать объекты, обнаруживать определенное поведение, отправлять оповещения и обеспечивать своевременное реагирование. Это превращает «сырые» данные в нечто практичное и ценное.

Дэвид также показал, что такой подход делает ИИ не просто интересным, а по-настоящему эффективным. Решая реальные проблемы, такие как отслеживание поведения и реагирование на него, поведенческий мониторинг может стать ключевой частью эффективных решений на базе ИИ в различных отраслях.

Link to this sectionВоплощение поведенческого ИИ в жизнь#

Затем Дэвид Скотт проиллюстрировал, как Ultralytics YOLOv8, модель компьютерного зрения, стала прорывом для проектов его команды по поведенческому отслеживанию. Она предоставила им прочную основу для обнаружения, классификации и отслеживания объектов. Его команда также пошла дальше и обучила YOLOv8 под свои нужды, сосредоточившись на мониторинге поведения в динамике, что сделало решение более практичным и полезным для реальных условий.

Интересно, что с выходом Ultralytics YOLO11 решения, подобные тем, что создала The Main Branch, могут стать еще более надежными и точными. Эта новейшая модель предлагает такие функции, как повышенная точность и более быстрая обработка данных, которые улучшают способность отслеживать поведение. Мы обсудим это более подробно после того, как лучше поймем, для каких приложений можно использовать поведенческий ИИ.

Далее давайте разберем решения, о которых говорил Дэвид, и то, как технология поведенческого отслеживания используется в реальных приложениях для решения повседневных задач и оказания значимого влияния.

Link to this sectionHerdSense с анализом поведения на базе ИИ#

Сначала Дэвид поделился захватывающим проектом под названием HerdSense, с которым они столкнулись. Он включал мониторинг здоровья тысяч коров на огромной откормочной площадке. Цель заключалась в отслеживании поведения каждой коровы для выявления потенциальных проблем со здоровьем. Это означало, что нужно было следить за десятками тысяч животных одновременно, и это была непростая задача.

HerdSense отслеживает и идентифицирует коров с помощью поведенческого ИИ

Рис. 2. HerdSense фокусируется на мониторинге и идентификации коров с помощью поведенческого ИИ.

Чтобы начать решать проблему идентификации каждой коровы и отслеживания ее поведения, команда Дэвида провела двухдневный семинар, на котором описала все возможные виды поведения, требующие контроля. В общей сложности они выявили более 200 типов поведения.

Каждый из 200 типов поведения зависел от способности точно распознавать отдельных коров, поскольку все данные должны были быть привязаны к конкретным животным. Одной из главных проблем было отслеживание коров, когда они сбивались в стадо, из-за чего было трудно увидеть отдельных особей.

Команда Дэвида разработала систему компьютерного зрения, чтобы гарантировать, что каждая корова постоянно идентифицируется, даже в сложных ситуациях. Им удалось подтвердить, что за одной и той же коровой всегда закрепляется один и тот же ID, даже если она пропадала из виду, смешивалась с другими или появлялась снова позже.

Link to this sectionМониторинг здоровья лошадей с помощью компьютерного зрения#

Двигаясь дальше, Дэвид представил еще один увлекательный проект, где они применили схожие методы поведенческого отслеживания для наблюдения за лошадьми. В этом проекте команде Дэвида не нужно было отслеживать ID каждой отдельной лошади так же пристально, как в случае с коровами. Вместо этого они сосредоточились на определенных поведенческих паттернах и отслеживали такие детали, как режим питания и общий уровень активности, чтобы вовремя заметить любые проблемы со здоровьем. Выявление небольших изменений в поведении может привести к более быстрому вмешательству, что обеспечит лучший уход и предотвратит проблемы, прежде чем они станут серьезными.

Мониторинг лошадей с помощью поведенческого ИИ

Рис. 3. Мониторинг лошадей с помощью поведенческого ИИ.

Link to this sectionПочему поведенческий ИИ не так прост, как кажется#

Дэвид также обсудил сложность поведенческого отслеживания на интригующем примере. Изучая способы улучшения поведенческого анализа, его команда столкнулась с компанией, которая заявила, что обнаруживает магазинные кражи, анализируя специфические позы, например, когда кто-то держит руку в кармане. На первый взгляд это казалось умной идеей: определенные движения могут указывать на подозрительное поведение, верно?

Понимание проблем технологии поведенческого отслеживания

Рис. 4. Понимание проблем технологии поведенческого отслеживания.

Однако, углубившись в тему, Дэвид осознал ограничения этого метода. Одна поза, например рука в кармане, не обязательно означает, что кто-то совершает кражу. Это может просто означать, что человек расслаблен, о чем-то задумался или даже замерз. Проблема фокусировки на изолированных позах в том, что она игнорирует более широкий контекст. Поведение — это не просто отдельное действие, это паттерн действий во времени, сформированный контекстом и намерением.

Дэвид подчеркнул, что истинное поведенческое отслеживание гораздо сложнее и требует комплексного подхода. Речь идет об анализе последовательностей действий и понимании того, что они означают в более широкой картине. Хотя индустрия ИИ делает успехи, он отметил, что предстоит еще много работы по развитию поведенческого отслеживания для получения значимых и точных результатов.

Link to this sectionСоздание более умных моделей ИИ для распознавания действий#

Затем Дэвид показал аудитории «закулисье» того, как его команда создала решение на основе компьютерного зрения для мониторинга здоровья коров с помощью YOLOv8 и его возможностей оценки позы.

Они начали с создания пользовательского датасета для оценки позы коровы, увеличив стандартное количество ключевых точек с 17 до 145, чтобы сделать модель лучше в анализе движений. Затем модель была обучена на массивном наборе данных, содержащем более 2 миллионов изображений и 110 миллионов примеров поведения.

Используя передовую аппаратную инфраструктуру, команда Дэвида смогла обучить модель всего за два дня вместо недель, которые потребовались бы на обычном оборудовании. Обученная модель была затем интегрирована с кастомным трекером поведения, который анализировал несколько видеокадров одновременно для обнаружения паттернов в действиях коров.

Результатом стало решение на базе ИИ, которое может обнаруживать и отслеживать восемь различных видов поведения коров, таких как еда, питье и лежание, чтобы заметить незначительные изменения, которые могут сигнализировать о проблемах со здоровьем. Это позволяет фермерам действовать быстро и улучшает управление стадом.

Link to this sectionПуть вперед для поведенческого ИИ#

Дэвид завершил свое выступление, поделившись важным уроком с аудиторией: «Если вы не даете ИИ права на ошибку, вы обрекаете себя на неудачу, потому что в конечном итоге все это статистика». Он отметил, что ИИ, несмотря на свои сильные стороны, не безупречен. Это инструмент, который учится на паттернах, и всегда будут ситуации, когда он ошибается. Вместо того чтобы бояться этих ошибок, ключ к успеху — создавать системы, которые могут их обрабатывать и продолжать совершенствоваться со временем.

Это также верно и в отношении моделей компьютерного зрения. Например, Ultralytics YOLO11, последняя версия моделей Ultralytics YOLO, была создана с учетом необходимости перехода на новый уровень по сравнению с YOLOv8.

Задачи компьютерного зрения, поддерживаемые YOLO11

Рис. 5. Задачи компьютерного зрения, поддерживаемые YOLO11.

В частности, YOLO11 предлагает лучшую производительность, особенно в приложениях реального времени, где точность имеет решающее значение, таких как сельское хозяйство и здравоохранение. Благодаря своим передовым функциям YOLO11 переопределяет то, как отрасли используют ИИ, предоставляя инновационные инсайты в реальном времени и помогая им более эффективно справляться с вызовами.

Link to this sectionОсновные выводы#

Выступление Дэвида на YV24 стало напоминанием о том, что ИИ — это не просто крутая инновация, это мощный инструмент для решения реальных проблем и улучшения того, как мы живем и работаем. Фокусируясь на поведении, ИИ уже оказывает влияние в таких областях, как отслеживание здоровья животных и распознавание значимых паттернов в повседневных действиях.

Потенциал поведенческого ИИ захватывает, и мы находимся только в самом начале. Преобразуя «сырые» данные в полезные инсайты, поведенческий ИИ переходит от пассивного мониторинга к активному решению проблем. По мере своего развития поведенческий ИИ будет способствовать принятию более разумных решений, оптимизации процессов и внесению значимых улучшений в нашу жизнь.

Оставайся на связи с нашим сообществом, чтобы узнавать больше об ИИ и его применении в реальном мире. Посети наш репозиторий GitHub, чтобы открыть для себя инновации в таких областях, как ИИ в сельском хозяйстве и компьютерное зрение в производстве.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения