Как стать инженером по компьютерному зрению
Исследуй преобразующую силу компьютерного зрения ИИ вместе с Ultralytics. Узнай об отраслевых применениях и учись у инженеров-экспертов, таких как Мухаммад Ризван Мунавар.

Компьютерное зрение (CV) — это область искусственного интеллекта, которая обучает компьютеры интерпретировать и понимать визуальный мир. Эта технология работает во многом так же, как человеческое зрение, но с несколькими заметными отличиями: у людей есть жизненный опыт, помогающий различать объекты, определять расстояние до них, понимать, находятся ли они в движении и нет ли чего-то подозрительного на изображении.
Технология CV относится к способности компьютеров не только визуализировать изображения, но и извлекать смысл или цель изображения, например, определять расстояния и движения приближающихся объектов. Благодаря успехам в области искусственного интеллекта и инновациям в глубоком обучении и нейронных сетях, эта сфера совершила огромный скачок в последние годы и смогла превзойти людей в некоторых задачах, связанных с обнаружением и маркировкой объектов.

CV позволяет создавать реальные решения для таких отраслей, как медицина, где она крайне полезна для внедрения диагностики. Однако полезность CV распространяется и на множество других областей, таких как спорт, ритейл, сельское хозяйство, транспорт, производство и многое другое. В Ultralytics мы делаем обучение моделей и машинное обучение доступными для каждого. Наша цель — помочь тебе воспользоваться мощью искусственного интеллекта, не вникая во все технические детали. Благодаря нашим усилиям мы видим, как даже ученики средних школ начинают обучать свои модели с помощью Ultralytics Platform и YOLOv5.
«Компьютерное зрение — одна из самых удивительных вещей, появившихся в мире глубокого обучения и искусственного интеллекта. Достижения, которые глубокое обучение привнесло в область компьютерного зрения, действительно выделили эту сферу».
Уэйн Томпсон, специалист по анализу данных SAS
Инженеры CV применяют исследования в области машинного обучения и зрения ИИ для решения реальных проблем. У инженеров CV обычно есть значительный опыт работы с различными системами, такими как распознавание изображений, машинное обучение, edge AI, сети и коммуникации, глубокое обучение, искусственный интеллект, передовые вычисления, аннотирование изображений, наука о данных и сегментация изображений/видео. Итак, без лишних слов, мы хотели бы представить тебе инженера по компьютерному зрению и поделиться его опытом.
Link to this sectionЗнакомься, Мухаммад!#

Мухаммад Ризван Мунавар — инженер по компьютерному зрению. Он получил степень бакалавра компьютерных наук со специализацией в области искусственного интеллекта в Университете COMSATS в Исламабаде (кампус Wah). Его экспертные знания не ограничиваются только областью зрения, потому что он знает, что дополнительные навыки помогают ему расти и продвигаться по карьерной лестнице, поэтому он также обладает знаниями в области разработки настольных приложений, веб-интерфейсов и создания привлекательных дашбордов. В настоящее время он работает фрилансером, разрабатывая решения для различных бизнес-кейсов в соответствии с потребностями клиентов.
Link to this sectionКак ты пришел в машинное обучение и ИИ зрения?#
«Ну, это был путь, полный препятствий и постоянного упорного труда. Когда я начинал, я даже не знал об обнаружении объектов, но я был любопытен и увлечен прежде всего ИИ зрения. Я был на последнем курсе учебы, когда начал заниматься фрилансом просто ради получения навыков. Параллельно я также начал изучать базовые концепции машинного обучения на различных YouTube-каналах. Потратив 7-8 месяцев на постоянную работу, я выработал хорошее понимание ИИ зрения и глубокого обучения и решил продолжить свою профессиональную карьеру в области CV».
Link to this sectionРасскажи нам о своем опыте работы с YOLOv5!#
«Я использую YOLOv5 с момента ее выпуска, но непосредственно для разработки и модификации под разные задачи я использую YOLOv5 уже 1,5 года». «Изначально проблема, с которой я столкнулся, была связана с обнаружением объектов, поэтому я начал исследовать различные алгоритмы для этого. Потратив некоторое время на исследования, я сравнил mAP для разных детекторов объектов и понял, что точность YOLOv5 на наборе данных COCO очень высока по сравнению с другими детекторами того времени. Поэтому я разметил свои данные и дообучил YOLOv5 на своих пользовательских данных с целью обнаружения людей». «YOLOv5 очень проста в использовании, модификации и тонкой настройке, а ее огромное сообщество всегда готово помочь, если кто-то сталкивается с проблемой. Регулярные обновления YOLOv5 каждый день упрощают для меня задачу эффективного обнаружения объектов».

Link to this section3 совета от Мухаммада для новичков#
- Регулярно изучай новые концепции и придерживайся постоянного распорядка. Мухаммад называет последовательность одним из главных факторов своего успеха.
- Постоянно думай о новых идеях, неважно, кажутся ли они глупыми! Они помогут тебе глубоко анализировать вещи. Попробуй реализовать эти идеи на определенном уровне и записывай их в документ. Всегда следуй этой стратегии.
- Разрабатывай проекты, связанные с CV. Регулярная работа над проектами поможет тебе учиться и развивать интерес к области CV.
Спасибо, что прочитал о пути Мухаммада! Если хочешь узнать больше о его работе, загляни на его сайт. А чтобы быть в курсе последних новостей о YOLOv5 и ИИ зрения, подписывайся на нас в Twitter и LinkedIn!






