Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Tornando-se um Engenheiro de Visão Computacional

Equipe Ultralytics

4 min de leitura

15 de novembro de 2022

Explore o poder transformador da IA de visão computacional com a Ultralytics. Descubra aplicações da indústria e aprenda com engenheiros especialistas como Muhammad Rizwan Munawar.

Visão computacional (VC) é um campo da inteligência artificial que treina computadores para interpretar e entender o mundo visual. A tecnologia funciona de forma muito semelhante à visão humana, mas com algumas diferenças notáveis: os humanos têm uma vida inteira de contexto para treinar como distinguir objetos, quão longe eles estão, se estão se movendo e se há algo errado com uma imagem.

A tecnologia de VC se relaciona com a capacidade dos computadores não apenas de visualizar imagens, mas também de extrair a mensagem ou o propósito de uma imagem, como determinar distâncias e movimentos de objetos que se aproximam. Graças aos avanços na inteligência artificial e às inovações em deep learning e redes neurais, o campo tem sido capaz de dar grandes saltos nos últimos anos e tem sido capaz de superar os humanos em algumas tarefas relacionadas à detecção e rotulagem de objetos.

A VC possibilita soluções do mundo real para indústrias como a indústria médica, por exemplo, onde é extremamente útil para implementações de diagnóstico. No entanto, a utilidade da VC também se estende a inúmeras outras aplicações, como esportes, varejo, agricultura, transporte, manufatura e muito mais. Na Ultralytics, tornamos os modelos de treinamento e o aprendizado de máquina acessíveis a todos. Nosso objetivo é ajudá-lo a aproveitar o poder da Inteligência Artificial sem ter que se preocupar com todos os detalhes técnicos. A partir de nossos esforços, vimos até alunos do ensino fundamental começarem a treinar seus modelos com o Ultralytics HUB e o YOLOv5.

"A visão computacional é uma das coisas mais notáveis que surgiram do mundo do deep learning e da inteligência artificial. Os avanços que o deep learning contribuiu para o campo da visão computacional realmente diferenciaram este campo."

Wayne Thompson, Cientista de Dados da SAS

Os engenheiros de VC aplicam a IA de visão e a pesquisa de aprendizado de máquina para resolver problemas do mundo real. Os engenheiros de VC geralmente têm uma quantidade significativa de experiência com vários sistemas, como reconhecimento de imagem, aprendizado de máquina, IA de ponta, redes e comunicação, deep learning, inteligência artificial, computação avançada, anotação de imagem, ciência de dados e segmentação de imagem/vídeo. Então, sem mais delongas, gostaríamos de apresentar a você um engenheiro de visão computacional e compartilhar sua experiência.

Conheça Muhammad!

Muhammad Rizwan Munawar

Muhammad Rizwan Munawar é um Engenheiro de Visão Computacional. Ele concluiu seu bacharelado em Ciência da Computação com Inteligência Artificial como área de especialização na COMSATS University Islamabad, Wah Campus. Sua experiência não se limita à área de visão, porque ele sabe que habilidades extras podem ajudá-lo a crescer e elevar sua carreira, então ele também tem conhecimento de aplicativos de desktop, front-end da web e desenvolvimento de painéis atraentes. Atualmente, ele trabalha como freelancer desenvolvendo soluções para diferentes casos de uso com base nas necessidades de seus clientes.

Como você começou no aprendizado de máquina e na IA de visão?

"Bem, tem sido uma jornada de obstáculos e trabalho duro consistente. Quando comecei, eu nem estava ciente da detecção de objetos, mas eu era curioso e apaixonado principalmente por IA de visão. Eu estava no último ano dos meus estudos, quando comecei a trabalhar como freelancer, apenas para aprender as habilidades. Paralelamente, também comecei a aprender conceitos básicos de aprendizado de máquina em vários canais do YouTube. Depois de passar 7-8 meses trabalhando consistentemente, desenvolvi uma boa compreensão de IA de visão e deep learning e decidi continuar minha carreira profissional no campo de VC."

Conte-nos sobre sua experiência com o YOLOv5!

"Eu tenho usado o YOLOv5 desde que foi lançado, mas para desenvolvimento e modificação adequados de acordo com diferentes casos de uso, tenho usado o YOLOv5 por 1,5 anos.""Inicialmente, o problema que eu estava lidando estava relacionado à detecção de objetos, então comecei a explorar diferentes algoritmos relacionados à detecção de objetos. Depois de passar algum tempo em pesquisa, comparei o mapa para diferentes detectores de objetos e percebi que a precisão do YOLOv5 no conjunto de dados coco é muito alta quando comparada a outros detectores de objetos na época. Então, eu rotulei meus dados e ajustei o YOLOv5 em meus dados personalizados, com o propósito de detectar pessoas."O YOLOv5 é muito fácil de usar, modificar e ajustar, e sua enorme comunidade está sempre disponível para ajudar se alguém encontrar um problema. As atualizações regulares do YOLOv5 me proporcionam facilidade diária para fazer a detecção de objetos de uma forma muito eficiente."    

3 dicas de Muhammad para iniciantes

  1. Aprenda regularmente novos conceitos e torne sua rotina consistente. Muhammad atribui a consistência como um dos maiores fatores em seu sucesso.
  2. Continue pensando em novas ideias, não importa se elas são estúpidas! Elas o ajudarão a pensar sobre as coisas em profundidade. Tente implementar essas ideias para um determinado nível e escreva-as em algum documento. Sempre siga esta estratégia.
  3. Desenvolva projetos relacionados à VC. Trabalhar regularmente em projetos o ajudará a aprender e desenvolver uma paixão em sua mente pelo campo de VC.

Obrigado por ler sobre a jornada de Muhammad! Se você quiser saber mais sobre seu trabalho, confira seu site. E, para se manter atualizado enquanto compartilhamos as notícias mais recentes sobre YOLOv5 e IA de visão com você, siga-nos no Twitter e no Linkedin!  

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência