Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Машинное зрение

Что такое машинное зрение? Узнайте, как эта AI-дисциплина обеспечивает промышленную автоматизацию, контроль качества и робототехнику. Узнайте об основных отличиях от компьютерного зрения.

Машинное зрение — это область технологий, которая позволяет машинам автоматически «видеть» и интерпретировать визуальный мир. Она объединяет камеры, освещение и программное обеспечение для захвата и анализа изображений, позволяя системам принимать решения или выполнять задачи на основе этой визуальной информации. Основная цель машинного зрения, используемого в основном в промышленных и автоматизированных средах, — выполнять конкретные, часто повторяющиеся задачи по инспекции и наведению с большей скоростью, точностью и последовательностью, чем операторы-люди. Это ключевой компонент, стимулирующий автоматизацию в таких секторах, как производство, логистика и робототехника.

Как работает машинное зрение

Типичная система машинного зрения объединяет несколько аппаратных и программных компонентов для функционирования. Процесс начинается с высокоскоростных камер и специализированного освещения, предназначенных для получения четких, согласованных изображений объекта или сцены. Этот шаг, известный как получение изображения, имеет решающее значение для надежной работы. Затем полученное изображение обрабатывается программным обеспечением, которое использует алгоритмы для анализа визуальных данных. Традиционно эти системы полагались на методы обработки изображений на основе правил. Однако современные системы машинного зрения все чаще включают машинное обучение (ML) и глубокое обучение (DL) для решения более сложных и переменных задач. На заключительном этапе система принимает решение, например, о прохождении или отклонении детали, или направляет руку робота. Весь рабочий процесс часто выполняется в режиме реального времени на аппаратном обеспечении обработки, начиная от промышленных ПК и заканчивая периферийными устройствами.

Машинное зрение vs. Компьютерное зрение

Хотя термины Machine Vision и Computer Vision (CV) часто используются как взаимозаменяемые, они имеют разные направления. Computer Vision — это более широкая научная область, занимающаяся тем, как научить компьютеры получать понимание высокого уровня из цифровых изображений или видео. Она охватывает широкий спектр приложений, от распознавания лиц до автономных транспортных средств.

Машинное зрение, напротив, обычно считается инженерной дисциплиной и подмножеством компьютерного зрения, ориентированным на практическое применение, особенно в промышленной автоматизации. Его приложения, как правило, ориентированы на конкретные задачи и выполняются в строго контролируемых средах. В то время как компьютерное зрение занимается пониманием изображения в общем смысле, машинное зрение занимается извлечением конкретной информации из изображения для выполнения задачи. Более подробную информацию о различиях можно найти в этом сравнении компьютерного зрения и обработки изображений.

Применение в реальном мире

Машинное зрение — краеугольный камень современной промышленной автоматизации. Его способность выполнять высокоскоростные и высокоточные визуальные задачи делает его бесценным во многих секторах.

  • Контроль качества в производстве: Одним из наиболее распространенных применений машинного зрения является автоматизированный контроль качества. Например, на линии розлива машинная система технического зрения может проверять тысячи бутылок в минуту на наличие трещин, обеспечивать правильный уровень наполнения и проверять правильность укупорки. Системы, основанные на таких моделях, как Ultralytics YOLO11, могут выполнять сложную детекцию объектов для выявления даже самых мелких дефектов. Это не только повышает качество продукции, но и снижает количество отходов и эксплуатационные расходы. Ассоциация по развитию автоматизации (A3) предоставляет обширные ресурсы по этой теме.
  • Guidance for Robotics (навигация для робототехники): Системы машинного зрения обеспечивают «глаза» для роботов, позволяя им выполнять сложные задачи с высокой точностью. На логистическом складе, управляемом ИИ, машинное зрение направляет роботов для идентификации, подбора и размещения предметов для сортировки и упаковки. Это включает в себя отслеживание объектов и оценку позы для понимания положения и ориентации объекта. Такие системы имеют решающее значение для высокоскоростных операций, требуемых центрами выполнения электронной коммерции, и являются важной частью робототехники и автоматизации.

Роль глубокого обучения

Интеграция глубокого обучения произвела революцию в машинном зрении. В то время как традиционные системы были ограничены алгоритмами, основанными на правилах, модели глубокого обучения, в частности сверточные нейронные сети (CNN), могут учиться на огромных объемах данных. Это позволяет им выявлять дефекты и особенности с таким уровнем нюансов и гибкости, который ранее был невозможен. Такие модели, как YOLOv8 и YOLO11, можно обучать на пользовательских наборах данных для распознавания широкого спектра объектов и аномалий, что делает их идеальными для таких задач, как сегментация экземпляров на производственных линиях. Платформы, такие как Ultralytics HUB, упрощают процесс обучения и развертывания этих передовых моделей. Фреймворки, такие как PyTorch и TensorFlow, обеспечивают основу для построения этих сложных систем, обеспечивая более надежные и интеллектуальные решения машинного зрения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена