Поведенческий ИИ делает компьютерное зрение более эффективным

Абирами Вина

4 мин. чтения

6 января 2025 г.

Присоединяйтесь к нам, чтобы пересмотреть доклад Дэвида Скотта YOLO Vision 2024, посвященный анализу поведения на основе ИИ и его реальному применению в таких отраслях, как животноводство.

В течение многих лет инновации в области компьютерного зрения были направлены на решение таких задач, как обнаружение объектов - идентификация таких объектов, как собака или автомобиль, на изображениях и видео. Эти подходы позволили найти применение в таких областях, как автономные транспортные средства, производство и здравоохранение. 

Однако зачастую эти задачи сводятся лишь к определению того, что представляет собой объект. А что, если бы системы искусственного интеллекта могли пойти на шаг дальше? Например, вместо того чтобы просто обнаружить собаку, можно было бы понять, что собака гонится за мячом или что автомобиль резко тормозит, потому что пешеход переходит дорогу. Этот переход от базового распознавания к контекстному пониманию представляет собой серьезный сдвиг к более умному, учитывающему контекст поведенческому ИИ.

На YOLO Vision 2024 (YV24), ежегодном гибридном мероприятии Ultralytics, посвященном достижениям в области Vision AI, концепция анализа поведения на основе ИИ заняла центральное место в интересном выступлении Дэвида Скотта, генерального директора компании The Main Branch.

В своем выступлении Дэвид рассказал о переходе от базовых задач компьютерного зрения к отслеживанию поведения. Имея более чем 25-летний опыт создания передовых технологических приложений, он продемонстрировал влияние этого скачка. Он подчеркнул, как декодирование моделей и поведения изменяет такие отрасли, как сельское хозяйство и защита животных.

В этой статье мы рассмотрим основные моменты выступления Дэвида и узнаем, как отслеживание поведения делает ИИ более практичным. 

Понимание проблем внедрения ИИ

Дэвид Скотт начал свой доклад со смелой проверки реальности и сказал: "Мой коллега часто говорит: "Наука не продается", что немного обижает многих из нас, потому что мы действительно любим науку. ИИ действительно крут - почему бы людям просто не купить его? Но реальность такова, что люди не хотят покупать его только потому, что мы считаем его крутым; им нужна причина, чтобы купить его".

Он рассказал, что в его компании The Main Branch основное внимание всегда уделяется решению реальных проблем с помощью ИИ, а не просто демонстрации его возможностей. Многие клиенты приходят с желанием рассказать о том, как они могут использовать ИИ в целом, но он считает такой подход отсталым - это все равно, что иметь решение без проблемы. Вместо этого они работают с клиентами, которые приходят с конкретными проблемами, чтобы они могли создавать решения на основе ИИ, которые действительно приносят пользу.

__wf_reserved_inherit
Рис. 1. Дэвид Скотт на сцене YV24.

Дэвид также рассказал, что их работа часто выходит за рамки простого распознавания объектов в сцене. Выявление объектов - это только первый шаг. Настоящая ценность заключается в том, чтобы понять, что делать с этой информацией и сделать ее полезной в рамках более крупной цепочки создания стоимости. 

Технология отслеживания поведения: ключ к действенному ИИ

Важнейшим шагом в создании действительно полезного ИИ является выход за рамки базовых задач компьютерного зрения, таких как обнаружение объектов, и использование этих знаний для отслеживания поведения. Дэвид подчеркнул, что поведенческий ИИ фокусируется на понимании действий и закономерностей, а не просто на идентификации объектов. Это делает ИИ способным распознавать значимые события и предоставлять полезные сведения.

Он привел пример животного, катающегося по полу, что может свидетельствовать о болезни. Если люди не могут круглосуточно наблюдать за животными, то системы видеонаблюдения на базе ИИ с функцией отслеживания поведения могут это сделать. Такие решения могут непрерывно наблюдать за объектами, выявлять специфическое поведение, отправлять сигнал тревоги и принимать своевременные меры. Таким образом, необработанные данные превращаются в нечто практичное и ценное.

Дэвид также продемонстрировал, что такой подход делает ИИ не просто интересным, а по-настоящему действенным. Благодаря решению реальных проблем, таких как отслеживание поведения и принятие соответствующих мер, отслеживание поведения может стать ключевой частью эффективных решений ИИ в различных отраслях.

Воплощение поведенческого ИИ в жизнь

Затем Дэвид Скотт рассказал о том, как Ultralytics YOLOv8, модель компьютерного зрения, стала прорывом для проектов его команды по отслеживанию поведения. Она дала им прочную основу для обнаружения, классификации и отслеживания объектов. Его команда также сделала еще один шаг вперед и настроила YOLOv8 на отслеживание поведения с течением времени, что сделало ее более практичной и полезной для реальных ситуаций.

Интересно, что с выходом Ultralytics YOLO11 решения, подобные созданным The Main Branch, могут стать еще более надежными и точными. Последняя модель предлагает такие функции, как повышенная точность и более быстрая обработка данных, что повышает ее способность отслеживать поведение. Мы обсудим это более подробно после того, как лучше поймем, для каких целей можно использовать поведенческий ИИ.

Далее мы рассмотрим решения, о которых говорил Дэвид, и то, как технология отслеживания поведения используется в реальных приложениях для решения повседневных задач и оказания значимого влияния.

HerdSense с анализом поведения на основе искусственного интеллекта

Сначала Дэвид рассказал о захватывающей задаче, которую они решали в рамках проекта под названием HerdSense, связанного с мониторингом здоровья тысяч коров на огромном откормочном комплексе. Цель заключалась в отслеживании поведения отдельных коров для выявления потенциальных проблем со здоровьем. Это означало одновременное наблюдение за десятками тысяч животных, и задача была не из простых.

__wf_reserved_inherit
Рис. 2. Компания HerdSense сосредоточилась на мониторинге и идентификации коров с помощью поведенческого ИИ.

Чтобы начать решать проблему идентификации каждой коровы и отслеживания ее поведения, команда Дэвида провела двухдневный семинар, на котором были описаны все возможные виды поведения, которые необходимо отслеживать. В общей сложности они определили более 200 видов поведения.

Каждая из 200 моделей поведения зависела от возможности точно распознать отдельных коров, поскольку все данные должны были быть привязаны к конкретным животным. Одной из главных проблем было отслеживание коров, когда они сбивались в стаи, что затрудняло наблюдение за отдельными животными. 

Команда Дэвида разработала систему компьютерного зрения, чтобы обеспечить постоянную идентификацию каждой коровы, даже в сложных ситуациях. Они смогли убедиться, что одной и той же корове всегда будет присвоен один и тот же идентификатор, даже если она исчезнет из виду, смешается с другими или появится снова.

Мониторинг здоровья лошадей с помощью компьютерного зрения

Далее Дэвид представил еще один интересный проект, в котором они применили аналогичные методы отслеживания поведения для наблюдения за лошадьми. В этом проекте команде Дэвида не нужно было отслеживать индивидуальные идентификаторы лошадей так же тщательно, как в случае с коровами. Вместо этого они сосредоточились на конкретных формах поведения и отслеживали такие детали, как режим питания и общий уровень активности, чтобы выявить любые проблемы со здоровьем на ранней стадии. Выявление небольших изменений в поведении может привести к более быстрому вмешательству, чтобы обеспечить лучший уход и предотвратить проблемы до того, как они станут серьезными.

__wf_reserved_inherit
Рис. 3. Наблюдение за лошадьми с помощью поведенческого ИИ.

Почему поведенческий ИИ не так прост, как кажется

Дэвид также рассказал о сложности отслеживания поведения на интригующем примере. Изучая способы улучшения поведенческого анализа, его команда наткнулась на компанию, утверждающую, что она может обнаружить кражу в магазине, анализируя определенные позы, например, когда человек держит руку в кармане. Поначалу это казалось разумной идеей - ведь определенные движения могут свидетельствовать о подозрительном поведении, верно?

__wf_reserved_inherit
Рис. 4. Понимание проблем, связанных с технологией отслеживания поведения.

Однако по мере дальнейшего изучения Дэвид осознал ограниченность этого метода. Одна-единственная поза, например рука в кармане, не обязательно означает, что человек ворует в магазине. Она может означать, что человек расслаблен, задумался или даже замерз. Проблема с концентрацией внимания на отдельных позах заключается в том, что при этом игнорируется более широкий контекст. Поведение - это не просто одно действие, это совокупность действий, формирующихся в течение определенного времени под влиянием контекста и намерений.

Дэвид подчеркнул, что истинное отслеживание поведения гораздо сложнее и требует целостного подхода. Речь идет об анализе последовательностей действий и понимании того, что они означают в общей картине. Несмотря на то, что индустрия ИИ делает успехи, он отметил, что еще многое предстоит сделать для развития поведенческого отслеживания, чтобы получить значимые и точные данные.

Создание более интеллектуальных моделей ИИ, понимающих действия

Затем Дэвид провел аудиторию за кулисы, чтобы показать, как его команда создала решение для мониторинга состояния здоровья коров с помощью YOLOv8 и его возможностей оценки позы.

Для начала они создали собственный набор данных для оценки позы коровы, увеличив стандартное количество ключевых точек с 17 до 145, чтобы модель лучше анализировала движения. Затем модель была обучена на огромном наборе данных, включающем более 2 миллионов изображений и 110 миллионов примеров поведения. 

Используя передовую аппаратную инфраструктуру, команда Дэвида смогла обучить модель всего за два дня, а не за недели, которые потребовались бы на обычном оборудовании. Обученная модель была интегрирована с пользовательским устройством отслеживания поведения, которое анализировало несколько видеокадров одновременно, чтобы обнаружить закономерности в действиях коров.

В результате было разработано решение на основе искусственного интеллекта, способное обнаруживать и отслеживать восемь различных видов поведения коров, таких как еда, питье и лежание, чтобы заметить незначительные изменения в поведении, которые могут сигнализировать о проблемах со здоровьем. Это позволяет фермерам действовать быстро и улучшает управление стадом.

Путь, который предстоит пройти поведенческому ИИ

В завершение своего выступления Дэвид поделился с аудиторией важным уроком: "Если вы не даете ИИ возможности для неудач, вы сами себя настраиваете на неудачу, потому что в конце концов это статистика". Он отметил, что ИИ, несмотря на свои сильные стороны, не безупречен. Это инструмент, который учится на основе закономерностей, и всегда будут моменты, когда он не сможет сделать все правильно. Вместо того чтобы бояться этих ошибок, необходимо создавать системы, способные справиться с ними и продолжать совершенствоваться с течением времени.

Это справедливо и в отношении самих моделей компьютерного зрения. Например, Ultralytics YOLO11, последняя версия моделей Ultralytics YOLO, была создана с учетом необходимости выйти на новый уровень по сравнению с YOLOv8.

 

__wf_reserved_inherit
Рис. 5. Задачи компьютерного зрения, поддерживаемые YOLO11.

В частности, YOLO11 предлагает более высокую производительность, особенно в приложениях реального времени, где точность имеет ключевое значение, таких как сельское хозяйство и здравоохранение. Благодаря своим передовым функциям YOLO11 меняет представление об использовании ИИ в промышленности, предоставляя инновационные знания в реальном времени и помогая эффективнее решать проблемы.

Основные выводы

Выступление Дэвида на YV24 стало напоминанием о том, что ИИ - это не просто крутая инновация, а мощный инструмент для решения реальных проблем и улучшения нашей жизни и работы. Ориентируясь на поведение, ИИ уже оказывает влияние на такие области, как отслеживание здоровья животных и распознавание значимых закономерностей в повседневных действиях. 

Потенциал поведенческого ИИ очень велик, и мы находимся только в самом начале пути. Преобразуя необработанные данные в действенные идеи, поведенческий ИИ переходит от пассивного наблюдения к активному решению проблем. По мере дальнейшего развития поведенческий ИИ будет принимать более разумные решения, оптимизировать процессы и вносить значимые улучшения в нашу жизнь.

Поддерживайте связь с нашим сообществом, чтобы узнать больше об искусственном интеллекте и его реальных применениях. Посетите наш репозиторий GitHub, чтобы узнать об инновациях в таких областях, как ИИ в сельском хозяйстве и компьютерное зрение в производстве.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена