Узнайте, как искусственный интеллект и компьютерное зрение влияют на современную робототехнику. Научитесь использовать Ultralytics для восприятия в реальном времени, автономности и интеллектуальной автоматизации.
Робототехника — это междисциплинарная область, находящаяся на стыке инженерии, информатики и технологий, посвященная проектированию, конструированию и эксплуатации программируемых машин, известных как роботы. В то время как традиционная робототехника была сосредоточена на повторяющихся, заранее запрограммированных механических задачах, современная ситуация была коренным образом изменена благодаря интеграции искусственного интеллекта (ИИ) и машинного обучения (МО). Эта синергия позволяет машинам воспринимать окружающую среду с помощью датчиков, принимать автономные решения и учиться на основе взаимодействий, превращаясь из жестких инструментов автоматизации в интеллектуальных агентов, способных ориентироваться в сложных, неструктурированных реальных сценариях.
Чтобы робот мог эффективно работать за пределами контролируемой клетки, он должен обладать «восприятием» — способностью интерпретировать сенсорные данные. Компьютерное зрение (CV) выступает в качестве основного сенсорного модуля, обрабатывая визуальные данные, поступающие с камер, LiDAR и датчиков глубины. Передовые модели глубокого обучения (DL) позволяют роботам идентифицировать препятствия, считывать знаки или проверять продукты. Такие технологии, как Ultralytics , имеют решающее значение в этой области, поскольку обеспечивают высокоскоростное обнаружение объектов, необходимое для реагирования в режиме реального времени на встроенном оборудовании, таком как платформа NVIDIA .
Ключевые возможности машинного обучения, которые обеспечивают автономность роботов, включают:
Применение интеллектуальной робототехники меняет различные отрасли промышленности, повышая их эффективность и безопасность.
В парадигме Индустрии 4.0 «коботы» (коллаборативные роботы) работают бок о бок с людьми. Используя ИИ в производстве, эти системы применяют сегментацию изображений для выявления микроскопических дефектов на сборочных линиях, которые могут упустить из виду инспекторы-люди. Международная федерация робототехники (IFR) сообщает о значительном росте плотности этих интеллектуальных автоматизированных систем во всем мире.
Склады используют AMR для транспортировки товаров без фиксированной инфраструктуры. В отличие от старых автоматизированных транспортных средств (AGV), которые следовали по магнитным лентам, AMR используют автономную навигацию на базе Edge AI для динамического обхода препятствий. Эта возможность имеет центральное значение для современного ИИ в логистике, оптимизируя пропускную способность цепочки поставок.
Очень важно отличать физическую робототехнику от роботизированной автоматизации процессов (RPA), поскольку эти термины часто пересекаются в бизнес-контексте.
Хотя обе технологии направлены на повышение уровня автоматизации, робототехника манипулирует атомами, а RPA — битами.
Развертывание моделей машинного зрения на роботах часто требует оптимизации для низкой задержки вывода, чтобы обеспечить безопасность. Промежуточное программное обеспечение , такое как Robot Operating System (ROS), обычно используется для преодоления разрыва между алгоритмами машинного зрения и аппаратными исполнительными механизмами. Перед развертыванием разработчики часто используют Ultralytics для аннотирования специализированных наборов данных и управления жизненным циклом обучения в облаке.
Следующий пример демонстрирует, как Python может использовать модель зрения для detect в потоке с камеры, что является обычным требованием безопасности для мобильных роботов:
from ultralytics import YOLO
# Load a lightweight YOLO26 model optimized for edge devices
model = YOLO("yolo26n.pt")
# Process a live camera feed (source=0) with a generator for efficiency
results = model.predict(source=0, stream=True)
for result in results:
# Check if a person (class index 0) is detected with high confidence
if result.boxes.conf.numel() > 0 and 0 in result.boxes.cls:
print("Person detected! Triggering stop command.")
# robot.stop() # Hypothetical hardware interface call
В этой области наблюдается тенденция к созданию универсальных роботов, способных выполнять несколько задач одновременно, а не специализированных машин с одной функцией . Инновации в базовых моделях позволяют роботам понимать инструкции на естественном языке, что делает их доступными для пользователей, не имеющих технических знаний. Кроме того, достижения в области искусственного интеллекта в сельском хозяйстве приводят к появлению полностью автономных сельскохозяйственных машин, которые могут точно пропалывать, сеять и убирать урожай, сокращая использование химикатов и затраты на рабочую силу. Исследования таких учреждений, как Лаборатория компьютерных наук и искусственного интеллекта Массачусетского технологического института, продолжают расширять границы мягкой робототехники и взаимодействия человека и робота.