Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Поведенческий ИИ делает компьютерное зрение более эффективным

Абирами Вина

4 мин чтения

6 января 2025 г.

Присоединяйтесь к нам, и мы вернемся к основному докладу Дэвида Скотта на YOLO Vision 2024 об анализе поведения на основе ИИ и его реальных применениях в таких секторах, как животноводство.

В течение многих лет инновации в области компьютерного зрения были сосредоточены на таких задачах, как обнаружение объектов — идентификация объектов, таких как собака или автомобиль, на изображениях и видео. Эти подходы позволили использовать приложения в таких областях, как автономные транспортные средства, производство и здравоохранение. 

Однако, эти задачи часто сосредоточены только на определении того, что представляет собой объект. Что, если бы системы Vision AI могли пойти на шаг дальше? Например, вместо того, чтобы просто обнаруживать собаку, предположим, что она может понять, что собака гонится за мячом или что автомобиль внезапно тормозит, потому что пешеход переходит дорогу. Этот переход от базового распознавания к контекстному пониманию представляет собой серьезный сдвиг в сторону более умного, контекстно-зависимого поведенческого ИИ.

На YOLO Vision 2024 (YV24), ежегодном гибридном мероприятии Ultralytics, посвященном достижениям в области Vision AI, концепция анализа поведения на основе ИИ заняла центральное место во время интересного выступления Дэвида Скотта, генерального директора The Main Branch.

В своем выступлении Дэвид исследовал переход от базовых задач компьютерного зрения к отслеживанию поведения. Имея более чем 25-летний опыт создания передовых технологических приложений, он продемонстрировал влияние этого скачка. Он подчеркнул, как расшифровка закономерностей и поведения меняет такие отрасли, как сельское хозяйство и защита животных.

В этой статье мы рассмотрим основные моменты выступления Дэвида и изучим, как отслеживание поведения делает AI более практичным. 

Понимание проблем внедрения ИИ

Дэвид Скотт начал свой доклад с дерзкой проверки реальности и сказал: «Один мой коллега часто говорит: «Наука не продает», что оскорбляет многих из нас, потому что мы действительно любим науку. AI - это действительно круто - почему бы людям просто не покупать его? Но реальность такова, что люди не хотят покупать его только потому, что мы думаем, что это круто; им нужна причина, чтобы купить его».

Далее он объяснил, что в его компании The Main Branch основное внимание всегда уделяется решению реальных проблем с помощью ИИ, а не просто демонстрации его возможностей. Многие клиенты приходят, желая поговорить о том, как они могут использовать ИИ в целом, но он считает это обратным подходом - это все равно, что иметь решение без проблемы. Вместо этого они работают с клиентами, которые ставят конкретные задачи, чтобы они могли создавать решения на основе ИИ, которые действительно меняют ситуацию к лучшему.

__wf_reserved_inherit
Рис. 1. Дэвид Скотт на сцене YV24.

Дэвид также поделился, что их работа часто выходит за рамки простого распознавания объектов на сцене. Обнаружение того, что там есть, - это только первый шаг. Реальная ценность заключается в том, чтобы понять, что делать с этой информацией и сделать ее полезной в рамках более крупной цепочки создания стоимости. 

Технология отслеживания поведения: ключ к действенному ИИ

Важным шагом в обеспечении реальной полезности ИИ является выход за рамки базовых задач компьютерного зрения, таких как обнаружение объектов, и использование этих данных для отслеживания поведения. Дэвид подчеркнул, что поведенческий ИИ фокусируется на понимании действий и закономерностей, а не просто на идентификации объектов. Это делает ИИ способным распознавать значимые события и предоставлять полезную информацию.

Он привел пример с животным, катающимся по полу, что может указывать на болезнь. В то время как люди не могут круглосуточно наблюдать за животным, это могут делать системы наблюдения на основе ИИ с возможностями отслеживания поведения. Такие решения могут непрерывно отслеживать объекты, обнаруживать определенное поведение, отправлять оповещения и позволять своевременно принимать меры. Это превращает необработанные данные в нечто практичное и ценное.

Дэвид также продемонстрировал, что такой подход делает AI не просто интересным, а действительно эффективным. Решая реальные проблемы, такие как мониторинг поведения и реагирование на него, отслеживание поведения может стать ключевой частью эффективных решений AI в различных отраслях.

Воплощение поведенческого ИИ в жизнь

Затем Дэвид Скотт проиллюстрировал, как Ultralytics YOLOv8, модель компьютерного зрения, стала прорывом для проектов его команды по отслеживанию поведения. Она дала им прочную основу для обнаружения, классификации и отслеживания объектов. Его команда также пошла еще дальше и специально обучила YOLOv8, чтобы сосредоточиться на мониторинге поведения с течением времени, что сделало ее более практичной и полезной для реальных ситуаций.

Интересно, что с выпуском Ultralytics YOLO11 такие решения, как созданные The Main Branch, могут стать еще более надежными и точными. Эта новейшая модель предлагает такие функции, как повышенная точность и более быстрая обработка, которые повышают ее способность отслеживать поведение. Мы обсудим это более подробно после того, как лучше поймем приложения, в которых можно использовать поведенческий ИИ.

Далее, давайте рассмотрим решения, о которых говорил Дэвид, и то, как технология отслеживания поведения используется в реальных приложениях для решения повседневных задач и оказания значимого влияния.

HerdSense с анализом поведения на основе ИИ

Во-первых, Дэвид поделился интересной задачей, которую они решили с помощью проекта под названием HerdSense, который включал в себя мониторинг здоровья тысяч коров на огромной откормочной площадке. Цель состояла в том, чтобы отслеживать поведение отдельных коров для выявления потенциальных проблем со здоровьем. Это означало одновременное наблюдение за десятками тысяч животных, и это была непростая задача.

__wf_reserved_inherit
Рис. 2. HerdSense сосредоточилась на мониторинге и идентификации коров с использованием поведенческого ИИ.

Чтобы начать решать проблему идентификации каждой коровы и отслеживания ее поведения, команда Дэвида провела двухдневный семинар, чтобы определить каждое возможное поведение, которое им необходимо отслеживать. Всего они выявили более 200 видов поведения.

Каждое из 200 видов поведения зависело от точного распознавания отдельных коров, поскольку все данные должны были быть привязаны к конкретным животным. Одной из основных проблем было отслеживание коров, когда они собирались в кучу, что затрудняло наблюдение за отдельными животными. 

Команда Дэвида разработала систему компьютерного зрения, чтобы обеспечить последовательную идентификацию каждой коровы, даже в сложных ситуациях. Они смогли подтвердить, что одной и той же корове всегда будет присваиваться один и тот же идентификатор, даже если она исчезнет из поля зрения, смешается с другими или появится позже.

Мониторинг здоровья лошадей с использованием компьютерного зрения

Продолжая тему, Дэвид представил еще один интересный проект, в котором аналогичные методы отслеживания поведения применялись для наблюдения за лошадьми. В этом проекте команде Дэвида не нужно было так тщательно отслеживать ID каждой лошади, как в случае с коровами. Вместо этого они сосредоточились на конкретных моделях поведения и отслеживали такие детали, как режим питания и общий уровень активности, чтобы своевременно выявлять любые проблемы со здоровьем. Выявление незначительных изменений в поведении может привести к более быстрому вмешательству для обеспечения лучшего ухода и предотвращения проблем до того, как они станут серьезными.

__wf_reserved_inherit
Рис. 3. Мониторинг лошадей с помощью поведенческого ИИ.

Почему поведенческий ИИ не так прост, как кажется

Дэвид также обсудил сложность отслеживания поведения на интересном примере. Изучая способы улучшения анализа поведения, его команда наткнулась на компанию, утверждающую, что может обнаруживать кражи в магазинах путем анализа определенных поз, например, когда кто-то держит руку в кармане. На первый взгляд это показалось разумной идеей - определенные движения могут указывать на подозрительное поведение, верно?

__wf_reserved_inherit
Рис. 4. Понимание проблем технологии отслеживания поведения.

Однако, углубившись в вопрос, Дэвид осознал ограничения этого метода. Одна поза, например, рука в кармане, не обязательно означает, что кто-то совершает кражу в магазине. Это может просто указывать на то, что человек расслаблен, задумался или даже замерз. Проблема с акцентом на изолированных позах заключается в том, что игнорируется более широкий контекст. Поведение — это не просто единичное действие, это совокупность действий во времени, формируемая контекстом и намерением.

Дэвид подчеркнул, что истинное отслеживание поведения гораздо сложнее и требует целостного подхода. Речь идет об анализе последовательностей действий и понимании того, что они означают в более широкой перспективе. Хотя индустрия AI и добивается успехов, он отметил, что еще предстоит проделать работу по продвижению отслеживания поведения для предоставления значимых и точных данных.

Создание более интеллектуальных моделей Vision AI, которые понимают действия

Впоследствии Дэвид показал аудитории закулисье, чтобы продемонстрировать, как его команда создала решение компьютерного зрения для мониторинга здоровья коров с помощью YOLOv8 и ее возможностей оценки позы.

Они начали с создания пользовательского набора данных для оценки позы коровы, увеличив стандартное количество ключевых точек с 17 до 145, чтобы модель лучше анализировала движения. Затем модель была обучена на огромном наборе данных, содержащем более 2 миллионов изображений и 110 миллионов примеров поведения. 

Используя передовую аппаратную инфраструктуру, команда Дэвида смогла обучить модель всего за два дня вместо недель, которые потребовались бы на обычном оборудовании. Затем обученная модель была интегрирована с пользовательским трекером поведения, который анализировал несколько видеокадров одновременно для обнаружения закономерностей в действиях коров.

В результате было создано решение на основе Vision AI, которое может обнаруживать и отслеживать восемь различных видов поведения коров, таких как прием пищи, питье и лежание, чтобы выявлять незначительные изменения в поведении, которые могут указывать на проблемы со здоровьем. Это позволяет фермерам быстро реагировать и улучшает управление стадом.

Перспективы поведенческого ИИ

Дэвид завершил свою речь, поделившись важным уроком со слушателями: «Если вы не дадите AI возможности ошибаться, вы обрекаете себя на неудачу, потому что, в конце концов, это статистика». Он отметил, что AI, несмотря на свои сильные стороны, не является безупречным. Это инструмент, который учится на закономерностях, и всегда будут моменты, когда он будет ошибаться. Вместо того чтобы бояться этих ошибок, важно создавать системы, которые могут справляться с ними и продолжать совершенствоваться с течением времени.

Это также верно и в отношении самих моделей компьютерного зрения. Например, Ultralytics YOLO11, последняя версия моделей Ultralytics YOLO, была создана с учетом необходимости вывести вещи на новый уровень по сравнению с YOLOv8.

 

__wf_reserved_inherit
Рис. 5. Задачи компьютерного зрения, поддерживаемые YOLO11.

В частности, YOLO11 предлагает лучшую производительность, особенно в отношении приложений реального времени, где точность является ключевым фактором, например, в сельском хозяйстве и здравоохранении. Благодаря своим расширенным функциям, YOLO11 переопределяет способы использования ИИ в отраслях, предоставляя инновационные аналитические данные в режиме реального времени и помогая им более эффективно решать проблемы.

Основные выводы

Доклад Дэвида на YV24 стал напоминанием о том, что AI - это больше, чем просто крутая инновация, - это мощный инструмент для решения реальных проблем и улучшения нашей жизни и работы. Сосредоточившись на поведении, AI уже оказывает влияние в таких областях, как отслеживание здоровья животных и распознавание значимых закономерностей в повседневных действиях. 

Потенциал поведенческого ИИ огромен, и мы находимся только в начале пути. Преобразуя необработанные данные в практически применимые аналитические выводы, поведенческий ИИ переходит от пассивного мониторинга к активному решению проблем. По мере дальнейшего развития поведенческий ИИ будет способствовать принятию более разумных решений, оптимизации процессов и внесению значимых улучшений в нашу жизнь.

Оставайтесь на связи с нашим сообществом, чтобы узнать больше об ИИ и его реальном применении. Посетите наш репозиторий на GitHub, чтобы узнать об инновациях в таких областях, как ИИ в сельском хозяйстве и компьютерное зрение в производстве.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена