Cómo convertirse en ingeniero de visión artificial
Explora el poder transformador de la visión artificial por IA con Ultralytics. Descubre aplicaciones en la industria y aprende de ingenieros expertos como Muhammad Rizwan Munawar.

La visión artificial (CV, por sus siglas en inglés) es un campo de la inteligencia artificial que entrena a las computadoras para interpretar y entender el mundo visual. La tecnología funciona de forma muy similar a la vista humana, pero con algunas diferencias notables: los humanos contamos con toda una vida de contexto para entrenar cómo distinguir objetos, calcular a qué distancia se encuentran, saber si están en movimiento o si algo no encaja en una imagen.
La tecnología de CV se relaciona con la capacidad de las computadoras no solo de visualizar imágenes, sino también de extraer el mensaje o el propósito de una imagen, como determinar distancias y movimientos de objetos que se aproximan. Gracias a los avances en inteligencia artificial y a las innovaciones en aprendizaje profundo y redes neuronales, el campo ha logrado dar grandes saltos en los últimos años y ha conseguido superar a los humanos en algunas tareas relacionadas con la detección y el etiquetado de objetos.

La CV permite crear soluciones para el mundo real en sectores como la industria médica, por ejemplo, donde resulta extremadamente útil para implementaciones de diagnóstico. Sin embargo, la utilidad de la CV también se extiende a numerosas aplicaciones, como el deporte, el comercio minorista, la agricultura, el transporte, la fabricación y más. En Ultralytics, hacemos que el entrenamiento de modelos y el aprendizaje automático sean accesibles para todos. Nuestro objetivo es ayudarte a aprovechar el poder de la inteligencia artificial sin tener que preocuparte por todos los detalles técnicos. Gracias a nuestros esfuerzos, hemos visto cómo incluso estudiantes de secundaria comienzan a entrenar sus modelos con la Plataforma Ultralytics y YOLOv5.
“La visión artificial es una de las cosas más notables que han surgido del mundo del aprendizaje profundo y la inteligencia artificial. Los avances que el aprendizaje profundo ha aportado al campo de la visión artificial realmente han marcado la diferencia”.
Wayne Thompson, científico de datos en SAS
Los ingenieros de CV aplican la investigación en IA de visión y aprendizaje automático para resolver problemas del mundo real. Por lo general, los ingenieros de CV tienen una experiencia considerable con diversos sistemas, como el reconocimiento de imágenes, el aprendizaje automático, la IA en el borde (edge AI), la creación de redes y comunicación, el aprendizaje profundo, la inteligencia artificial, la computación avanzada, el etiquetado de imágenes, la ciencia de datos y la segmentación de imágenes/vídeo. Así que, sin más preámbulos, nos gustaría presentarte a un ingeniero de visión artificial y compartir su experiencia.
Link to this section¡Conoce a Muhammad!#

Muhammad Rizwan Munawar es ingeniero de visión artificial. Se graduó en Informática con especialización en Inteligencia Artificial por la Universidad COMSATS de Islamabad, campus Wah. Su experiencia no se limita al área de visión, ya que sabe que adquirir habilidades adicionales puede ayudarle a crecer y mejorar en su carrera; por eso también tiene conocimientos de aplicaciones de escritorio, front-end web y desarrollo de paneles atractivos. Actualmente, trabaja como freelance desarrollando soluciones para diferentes casos de uso según las necesidades de sus clientes.
Link to this section¿Cómo te adentraste en el aprendizaje automático y la IA de visión?#
"Bueno, ha sido un viaje lleno de obstáculos y trabajo duro constante. Cuando empecé, ni siquiera sabía qué era la detección de objetos, pero tenía curiosidad y me apasionaba principalmente la IA de visión. Estaba en el último año de mis estudios cuando empecé a trabajar como freelance, solo para aprender habilidades. Paralelamente, también comencé a aprender conceptos básicos de aprendizaje automático en varios canales de YouTube. Tras 7-8 meses de trabajo constante, desarrollé una buena comprensión de la IA de visión y el aprendizaje profundo, y decidí continuar mi carrera profesional en el campo de la CV".
Link to this section¡Cuéntanos tu experiencia con YOLOv5!#
"He estado usando YOLOv5 desde que se lanzó, pero para un desarrollo y modificación adecuados según los diferentes casos de uso, llevo 1,5 años utilizándolo". "Al principio, el problema que tenía estaba relacionado con la detección de objetos, así que comencé a explorar diferentes algoritmos. Después de dedicar algo de tiempo a investigar, comparé el mAP de diferentes detectores de objetos y me di cuenta de que la precisión de YOLOv5 en el conjunto de datos COCO es muy alta en comparación con otros detectores de aquel entonces. Por lo tanto, etiqueté mis datos y ajusté YOLOv5 a mis datos personalizados con el propósito de detectar personas". "YOLOv5 es muy fácil de usar, modificar y ajustar, y su enorme comunidad siempre está disponible para ayudar si alguien encuentra algún problema. Las actualizaciones periódicas de YOLOv5 me facilitan día a día realizar la detección de objetos de forma muy eficiente".

Link to this sectionLos 3 consejos de Muhammad para principiantes#
- Aprende conceptos nuevos con regularidad y haz que tu rutina sea constante. Muhammad atribuye a la constancia uno de los factores más importantes de su éxito.
- Sigue pensando en nuevas ideas, ¡no importa si parecen absurdas! Te ayudarán a reflexionar sobre las cosas en profundidad. Intenta implementar estas ideas hasta cierto punto y anótalas en algún documento. Sigue siempre esta estrategia.
- Desarrolla proyectos relacionados con la CV. Trabajar regularmente en proyectos te ayudará a aprender y a desarrollar la pasión por el campo de la CV.
¡Gracias por leer sobre la trayectoria de Muhammad! Si quieres saber más sobre su trabajo, echa un vistazo a su sitio web. Y para mantenerte al día mientras compartimos las noticias más recientes sobre YOLOv5 y la IA de visión, ¡síguenos en Twitter y LinkedIn!






