Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Узнайте больше из доклада Джозефа Нельсона (Joseph Nelson) на YV23 о Roboflow и Ultralytics YOLOv8. Изучите возможности сотрудничества с открытым исходным кодом и фундаментальные модели в компьютерном зрении.
Мы рады поделиться основными выводами из доклада Джозефа Нельсона на YOLO VISION 2023 (YV23), проходившем в Google for Startups Campus в Мадриде.
Джозеф, соучредитель и генеральный директор Roboflow, углубился в фундаментальные модели, сотрудничество с открытым исходным кодом и увлекательную область Ultralytics YOLOv8. Roboflow — это платформа, позволяющая разработчикам создавать первоклассные наборы данных и модели компьютерного зрения, и более четверти миллиона разработчиков используют их инструменты.
Почему компьютерное зрение?
Джозеф провел нас в путешествие, исследуя суть компьютерного зрения. По своей сути, компьютерное зрение — это область в рамках искусственного интеллекта (ИИ) и информатики, которая фокусируется на том, чтобы позволить компьютерам обрабатывать изображения и видео, извлекая из них данные и информацию, чтобы затем анализировать их по мере необходимости.
В нескольких словах, это превращает все, что мы видим, в программное обеспечение, что соответствует миссии сделать мир программируемым. Области применения безграничны: от улучшения управления запасами в розничной торговле до создания забавных фильтров Snapchat.
Джозеф поделился интересными примерами проектов, основанных на компьютерном зрении. Они варьировались от огнедышащих роботов для уничтожения сорняков и машин для упражнений для кошек (с лазерной указкой в комплекте!) до дронов, использующих аэрофотосъемку для обнаружения таких объектов, как солнечные панели, автоматизированных контроллеров OBS и даже инструмента, чтобы спасти нас от печально известного Rick Roll.
Фундаментальные модели: меняют правила игры
В докладе было представлено изменение парадигмы, вызванное фундаментальными моделями, с описанием трех сценариев:
Готовые к использованию модели: Вы можете использовать существующие модели, такие как CLIP от OpenAI, для таких задач, как фильтрация контента и создание подписей к изображениям. Это становится идеальным вариантом, когда требования к реальному времени не критичны и имеется доступ к значительным вычислительным мощностям.
Модели, которым нужна небольшая помощь: Можно использовать такие модели, как grounding dyno от Roboflow, для автоматической разметки и точной настройки под конкретные задачи. Это идеально подходит для таких случаев, как идентификация видов, когда базовая модель может быть улучшена для нужд конкретной области.
Создание с нуля: Где у вас есть традиционный рабочий процесс, включающий пользовательский сбор данных, обучение модели и постоянное улучшение. Это индивидуальное решение для решения проблем, связанных с конкретной областью, с требованиями к вычислениям в реальном времени или неограниченными требованиями.
Открываем возможности с Ultralytics
Джозеф подчеркнул возможности Ultralytics в ускорении рабочих процессов, упрощении создания, обучения и развертывания моделей. Ultralytics служит центром для наборов данных с открытым исходным кодом, моделей и множества бесценных ресурсов, таких как SaaS-инструмент без кода Ultralytics HUB.
В заключение
В заключение Джозеф призвал сообщество изучать эти инструменты, делиться опытом и продолжать формировать будущее компьютерного зрения. Давайте вместе отправимся в это путешествие, создавая инновационные решения и расширяя границы ИИ.
Узнайте больше об Open Source с развертыванием YOLOv8 здесь!