Глоссарий

Машинное зрение

Что такое машинное зрение? Узнайте, как эта дисциплина искусственного интеллекта обеспечивает промышленную автоматизацию, контроль качества и робототехнику. Узнайте о ее ключевых отличиях от компьютерного зрения.

Машинное зрение - это область технологий, позволяющая машинам "видеть" и интерпретировать визуальный мир автоматически. Оно объединяет камеры, освещение и программное обеспечение для захвата и анализа изображений, позволяя системам принимать решения или выполнять задачи на основе этой визуальной информации. Машинное зрение используется в основном в промышленных и автоматизированных средах, его основная цель - выполнять специфические, часто повторяющиеся задачи по осмотру и управлению с большей скоростью, точностью и последовательностью, чем операторы-люди. Это ключевой компонент, способствующий автоматизации в таких отраслях, как производство, логистика и робототехника.

Как работает машинное зрение

Типичная система машинного зрения объединяет несколько аппаратных и программных компонентов. Процесс начинается с использования высокоскоростных камер и специализированного освещения, предназначенных для получения четких и последовательных изображений объекта или сцены. Этот этап, известный как получение изображения, имеет решающее значение для надежной работы. Затем полученное изображение обрабатывается программным обеспечением, которое использует алгоритмы для анализа визуальных данных. Традиционно эти системы опирались на методы обработки изображений, основанные на правилах. Однако современные системы машинного зрения все чаще используют технологии машинного обучения (ML) и глубокого обучения (DL) для решения более сложных и изменчивых задач. На последнем этапе система принимает решение, например, о прохождении или провале детали или о направлении роботизированной руки. Весь рабочий процесс часто выполняется в режиме реального времени на вычислительном оборудовании - от промышленных ПК до граничных устройств.

Машинное зрение в сравнении с компьютерным зрением

Хотя термины "машинное зрение" и " компьютерное зрение" (КВ) часто используются как взаимозаменяемые, они имеют разную направленность. Компьютерное зрение - это более широкая научная область, связанная с тем, как можно заставить компьютеры получать высокоуровневое понимание из цифровых изображений или видео. Она охватывает широкий спектр приложений, от распознавания лиц до автономных транспортных средств.

Машинное зрение, напротив, обычно считается инженерной дисциплиной и подмножеством компьютерного зрения, ориентированным на практическое применение, особенно в промышленной автоматизации. Его приложения обычно ориентированы на конкретные задачи и выполняются в строго контролируемых условиях. В то время как компьютерное зрение - это понимание изображения в общем смысле, машинное зрение - это извлечение конкретной информации из изображения для выполнения задачи. Для получения более подробной информации о различиях вы можете изучить это сравнение между компьютерным зрением и обработкой изображений.

Применение в реальном мире

Машинное зрение является краеугольным камнем современной промышленной автоматизации. Его способность выполнять высокоскоростные и высокоточные визуальные задачи делает его неоценимым во многих отраслях.

  • Контроль качества в производстве: Одно из наиболее распространенных применений машинного зрения - автоматизированный контроль качества. Например, на линии розлива система машинного зрения может осматривать тысячи бутылок в минуту, чтобы проверить их на наличие трещин, убедиться в правильности уровня наполнения и проверить правильность укупорки. Системы на базе таких моделей, как Ultralytics YOLO11, могут выполнять сложное обнаружение объектов для выявления даже самых мелких дефектов. Это не только повышает качество продукции, но и снижает количество отходов и эксплуатационные расходы. Ассоциация по развитию автоматизации (A3) предоставляет обширные ресурсы по этой теме.
  • Ориентация для робототехники: Системы машинного зрения служат "глазами" для роботов, позволяя им выполнять сложные задачи с высокой точностью. На логистическом складе, управляемом искусственным интеллектом, система машинного зрения помогает роботам идентифицировать, отбирать и размещать товары для сортировки и упаковки. Для этого необходимо отследить объект и оценить его положение и ориентацию. Такие системы необходимы для выполнения высокоскоростных операций, требуемых в центрах электронной коммерции, и являются важной частью робототехники и автоматизации.

Роль глубокого обучения

Интеграция глубокого обучения произвела революцию в машинном зрении. Если традиционные системы были ограничены алгоритмами, основанными на правилах, то модели глубокого обучения, в частности конволюционные нейронные сети (CNN), способны обучаться на огромных объемах данных. Это позволяет им выявлять дефекты и особенности с таким уровнем нюансов и гибкости, который ранее был невозможен. Такие модели, как YOLOv8 и YOLO11, могут быть обучены на пользовательских наборах данных для распознавания широкого спектра объектов и аномалий, что делает их идеальными для таких задач, как сегментация экземпляров на производственных линиях. Платформы, подобные Ultralytics HUB, упрощают процесс обучения и развертывания этих передовых моделей. Такие фреймворки, как PyTorch и TensorFlow, обеспечивают основу для построения этих сложных систем, позволяя создавать более надежные и интеллектуальные решения в области машинного зрения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена