Присоединяйтесь к нам, чтобы пересмотреть доклад Дэвида Скотта YOLO Vision 2024, посвященный анализу поведения на основе ИИ и его реальному применению в таких отраслях, как животноводство.
Присоединяйтесь к нам, чтобы пересмотреть доклад Дэвида Скотта YOLO Vision 2024, посвященный анализу поведения на основе ИИ и его реальному применению в таких отраслях, как животноводство.
В течение многих лет инновации в области компьютерного зрения были сосредоточены на таких задачах, как обнаружение объектов — идентификация объектов, таких как собака или автомобиль, на изображениях и видео. Эти подходы позволили использовать приложения в таких областях, как автономные транспортные средства, производство и здравоохранение.
Однако, эти задачи часто сосредоточены только на определении того, что представляет собой объект. Что, если бы системы Vision AI могли пойти на шаг дальше? Например, вместо того, чтобы просто обнаруживать собаку, предположим, что она может понять, что собака гонится за мячом или что автомобиль внезапно тормозит, потому что пешеход переходит дорогу. Этот переход от базового распознавания к контекстному пониманию представляет собой серьезный сдвиг в сторону более умного, контекстно-зависимого поведенческого ИИ.
На YOLO Vision 2024 (YV24), ежегодном гибридном мероприятии Ultralytics, посвященном достижениям в области Vision AI, концепция анализа поведения на основе ИИ заняла центральное место в интересном выступлении Дэвида Скотта, генерального директора компании The Main Branch.
В своем выступлении Дэвид исследовал переход от базовых задач компьютерного зрения к отслеживанию поведения. Имея более чем 25-летний опыт создания передовых технологических приложений, он продемонстрировал влияние этого скачка. Он подчеркнул, как расшифровка закономерностей и поведения меняет такие отрасли, как сельское хозяйство и защита животных.
В этой статье мы рассмотрим основные моменты выступления Дэвида и изучим, как отслеживание поведения делает AI более практичным.
Дэвид Скотт начал свой доклад с дерзкой проверки реальности и сказал: «Один мой коллега часто говорит: «Наука не продает», что оскорбляет многих из нас, потому что мы действительно любим науку. AI - это действительно круто - почему бы людям просто не покупать его? Но реальность такова, что люди не хотят покупать его только потому, что мы думаем, что это круто; им нужна причина, чтобы купить его».
Далее он объяснил, что в его компании The Main Branch основное внимание всегда уделяется решению реальных проблем с помощью ИИ, а не просто демонстрации его возможностей. Многие клиенты приходят, желая поговорить о том, как они могут использовать ИИ в целом, но он считает это обратным подходом - это все равно, что иметь решение без проблемы. Вместо этого они работают с клиентами, которые ставят конкретные задачи, чтобы они могли создавать решения на основе ИИ, которые действительно меняют ситуацию к лучшему.

Дэвид также поделился, что их работа часто выходит за рамки простого распознавания объектов на сцене. Обнаружение того, что там есть, - это только первый шаг. Реальная ценность заключается в том, чтобы понять, что делать с этой информацией и сделать ее полезной в рамках более крупной цепочки создания стоимости.
Важным шагом в обеспечении реальной полезности ИИ является выход за рамки базовых задач компьютерного зрения, таких как обнаружение объектов, и использование этих данных для отслеживания поведения. Дэвид подчеркнул, что поведенческий ИИ фокусируется на понимании действий и закономерностей, а не просто на идентификации объектов. Это делает ИИ способным распознавать значимые события и предоставлять полезную информацию.
Он привел пример животного, катающегося по полу, что может свидетельствовать о болезни. Если люди не могут круглосуточно наблюдать за животными, то системы видеонаблюдения на базе ИИ с функцией отслеживания поведения могут это сделать. Такие решения могут непрерывно наблюдать за объектами, detect специфическое поведение, отправлять сигнал тревоги и принимать своевременные меры. Таким образом, необработанные данные превращаются в нечто практичное и ценное.
Дэвид также продемонстрировал, что такой подход делает AI не просто интересным, а действительно эффективным. Решая реальные проблемы, такие как мониторинг поведения и реагирование на него, отслеживание поведения может стать ключевой частью эффективных решений AI в различных отраслях.
Затем Дэвид Скотт проиллюстрировал, как Ultralytics YOLOv8модель компьютерного зрения, стала прорывом для проектов его команды по отслеживанию поведения. Она дала им прочную основу для обнаружения, классификации и отслеживания объектов. Его команда также сделала еще один шаг вперед и настроила YOLOv8 на отслеживание поведения с течением времени, что сделало ее более практичной и полезной для реальных ситуаций.
Интересно, что с выходом Ultralytics YOLO11решения, подобные тем, что создала компания The Main Branch, стали еще более надежными и точными. Эта новейшая модель предлагает такие функции, как повышенная точность и более быстрая обработка данных, что расширяет ее возможности по track поведения. Мы обсудим это более подробно после того, как лучше поймем, для каких целей можно использовать поведенческий ИИ.
Далее, давайте рассмотрим решения, о которых говорил Дэвид, и то, как технология отслеживания поведения используется в реальных приложениях для решения повседневных задач и оказания значимого влияния.
Сначала Дэвид рассказал о захватывающей задаче, которую они решали в рамках проекта под названием HerdSense, связанного с мониторингом здоровья тысяч коров на огромном откормочном комплексе. Цель заключалась в track поведения отдельных коров для выявления потенциальных проблем со здоровьем. Это означало одновременное наблюдение за десятками тысяч животных, и задача была не из простых.

Чтобы начать решать проблему идентификации каждой коровы и отслеживания ее поведения, команда Дэвида провела двухдневный семинар, чтобы определить каждое возможное поведение, которое им необходимо отслеживать. Всего они выявили более 200 видов поведения.
Каждое из 200 видов поведения зависело от точного распознавания отдельных коров, поскольку все данные должны были быть привязаны к конкретным животным. Одной из основных проблем было отслеживание коров, когда они собирались в кучу, что затрудняло наблюдение за отдельными животными.
Команда Дэвида разработала систему компьютерного зрения, чтобы обеспечить последовательную идентификацию каждой коровы, даже в сложных ситуациях. Они смогли подтвердить, что одной и той же корове всегда будет присваиваться один и тот же идентификатор, даже если она исчезнет из поля зрения, смешается с другими или появится позже.
Далее Дэвид представил еще один увлекательный проект, в котором они применили аналогичную технику отслеживания поведения для наблюдения за лошадьми. В этом проекте команде Дэвида не нужно было track индивидуальные идентификаторы лошадей так тщательно, как это было сделано с коровами. Вместо этого они сосредоточились на конкретных формах поведения и отслеживали такие детали, как режим питания и общий уровень активности, чтобы выявить любые проблемы со здоровьем на ранней стадии. Выявление небольших изменений в поведении может привести к более быстрому вмешательству, чтобы обеспечить лучший уход и предотвратить проблемы до того, как они станут серьезными.

Дэвид также рассказал о сложности отслеживания поведения на интригующем примере. Изучая способы улучшения поведенческого анализа, его команда наткнулась на компанию, утверждающую, что она может detect кражу в магазине, анализируя определенные позы, например, когда человек держит руку в кармане. Поначалу это казалось разумной идеей - ведь определенные движения могут навести на мысль о подозрительном поведении, верно?

Однако, углубившись в вопрос, Дэвид осознал ограничения этого метода. Одна поза, например, рука в кармане, не обязательно означает, что кто-то совершает кражу в магазине. Это может просто указывать на то, что человек расслаблен, задумался или даже замерз. Проблема с акцентом на изолированных позах заключается в том, что игнорируется более широкий контекст. Поведение — это не просто единичное действие, это совокупность действий во времени, формируемая контекстом и намерением.
Дэвид подчеркнул, что истинное отслеживание поведения гораздо сложнее и требует целостного подхода. Речь идет об анализе последовательностей действий и понимании того, что они означают в более широкой перспективе. Хотя индустрия AI и добивается успехов, он отметил, что еще предстоит проделать работу по продвижению отслеживания поведения для предоставления значимых и точных данных.
Затем Дэвид провел аудиторию за кулисы, чтобы показать, как его команда создала решение для мониторинга состояния здоровья коров с помощью YOLOv8 и его возможностей оценки позы.
Они начали с создания пользовательского набора данных для оценки позы коровы, увеличив стандартное количество ключевых точек с 17 до 145, чтобы модель лучше анализировала движения. Затем модель была обучена на огромном наборе данных, содержащем более 2 миллионов изображений и 110 миллионов примеров поведения.
Используя передовую аппаратную инфраструктуру, команда Дэвида смогла обучить модель всего за два дня, а не за недели, которые потребовались бы на обычном оборудовании. Обученная модель была интегрирована с пользовательским устройством отслеживания поведения, которое анализировало несколько видеокадров одновременно, чтобы detect закономерности в действиях коров.
В результате было разработано решение на основе искусственного интеллекта, способное detect и track восемь различных видов поведения коров, таких как еда, питье и лежание, чтобы заметить незначительные изменения в поведении, которые могут сигнализировать о проблемах со здоровьем. Это позволяет фермерам действовать быстро и улучшает управление стадом.
Дэвид завершил свою речь, поделившись важным уроком со слушателями: «Если вы не дадите AI возможности ошибаться, вы обрекаете себя на неудачу, потому что, в конце концов, это статистика». Он отметил, что AI, несмотря на свои сильные стороны, не является безупречным. Это инструмент, который учится на закономерностях, и всегда будут моменты, когда он будет ошибаться. Вместо того чтобы бояться этих ошибок, важно создавать системы, которые могут справляться с ними и продолжать совершенствоваться с течением времени.
Это справедливо и в отношении самих моделей компьютерного зрения. Например, Ultralytics YOLO11, последняя версия моделей Ultralytics YOLO , была создана с учетом необходимости выйти на новый уровень по сравнению с YOLOv8.

В частности, YOLO11 предлагает более высокую производительность, особенно в приложениях реального времени, где точность имеет ключевое значение, таких как сельское хозяйство и здравоохранение. Благодаря своим передовым функциям YOLO11 меняет представление об использовании ИИ в промышленности, предоставляя инновационные знания в реальном времени и помогая эффективнее решать проблемы.
Доклад Дэвида на YV24 стал напоминанием о том, что AI - это больше, чем просто крутая инновация, - это мощный инструмент для решения реальных проблем и улучшения нашей жизни и работы. Сосредоточившись на поведении, AI уже оказывает влияние в таких областях, как отслеживание здоровья животных и распознавание значимых закономерностей в повседневных действиях.
Потенциал поведенческого ИИ огромен, и мы находимся только в начале пути. Преобразуя необработанные данные в практически применимые аналитические выводы, поведенческий ИИ переходит от пассивного мониторинга к активному решению проблем. По мере дальнейшего развития поведенческий ИИ будет способствовать принятию более разумных решений, оптимизации процессов и внесению значимых улучшений в нашу жизнь.
Оставайтесь на связи с нашим сообществом, чтобы узнать больше об ИИ и его реальном применении. Посетите наш репозиторий на GitHub, чтобы узнать об инновациях в таких областях, как ИИ в сельском хозяйстве и компьютерное зрение в производстве.