YOLO VISION 2022: la nueva frontera de la IA visual

Equipo Ultralytics

3 min leer

20 de octubre de 2022

Descubra la visión de YOLO VISION 2022 con charlas sobre IA en diversos sectores y lo último en aprendizaje automático de la mano de expertos de Ultralytics.

Nuestra primera YOLO VISION tuvo lugar el 27 de septiembre de 2022. Desde la entrada de la IA en la industria automovilística hasta el análisis en tiempo real de la producción de fruta, escuchamos charlas inspiradoras de usuarios de YOLOv5 de todos los ámbitos.

Algo que hizo especial este acto fue la gran variedad de procedencias de los ponentes. Junto con representantes de 18 empresas participantes, los ponentes ofrecieron perspectivas de todos los aspectos del proceso de ML. Entre ellas, se encuentran nuestras empresas asociadas, como Comet, Deci, ClearML, Paperspace y Roboflow, así como otras del espacio de código abierto, como los gigantes chinos Baidu, Meituan y OpenMMLabs.

YOLOv5 redefine el estado del arte

¿Se pregunta cuál es la historia de la creación de YOLOv5 y la metodología empleada en I+D?

Sumérjase en los detalles del enfoque holístico utilizado para elegir las mejores arquitecturas con Glenn Jocher, nuestro Fundador y CEO aquí en Ultralytics, y Ayush Chaurasia, nuestro Ingeniero ML.


Las grandes arquitecturas de modelos como YOLOv5 son cruciales para obtener resultados útiles en el aprendizaje automático. Pero los modelos son tan buenos como sus conjuntos de datos. Joseph Nelson, CEO y cofundador de nuestro socio Roboflow, mostró el impacto de la calidad del conjunto de datos en los resultados de producción. Las conclusiones se basan en más de 10.000 trabajos de formación de visión y en la comunidad de código abierto de Roboflow Universe, que cuenta con más de 90.000 conjuntos de datos.

En su sesión, Joseph también mostró las diferencias clave entre investigación y producción que permiten a los desarrolladores piratear sus conjuntos de datos para obtener resultados significativos más rápidamente.

Infórmese sobre la calidad de los conjuntos de datos y su repercusión en el valor de producción de su modelo de CV.

Prácticas recomendadas para validar el modelo y los datos de ML antes de la implantación

Hoy en día, todos los programas informáticos tradicionales se someten a pruebas exhaustivas de diversos tipos antes de su implantación, lo que reduce considerablemente el riesgo de fallos de producción.

¿Cómo podemos adaptar estas ideas al mundo estadístico del ML?

Aishwarya Srinivasan, científica de datos en Google y defensora de los desarrolladores de código abierto en Deepchecks, habla de la emoción que hay detrás de la creación de soluciones capaces de resolver retos del mundo real. En Google, crea soluciones de aprendizaje automático para casos de uso de los clientes, aprovechando los principales productos de Google, como TensorFlow, DataFlow y AI Platform.

Aishwarya se unió a nosotros en YOLO VISION para hablar de las mejores prácticas y consejos prácticos para probar y analizar exhaustivamente su modelo. Echa un vistazo a su charla para aprender la diferencia entre Testing Software y Testing ML.

Proyectos de código abierto para el futuro de la IA de visión por ordenador

Organizamos un panel innovador en el que reunimos a otros miembros de la familia de arquitecturas YOLO, así como a otras arquitecturas de IA de visión de código abierto de primera línea en el sector.

Aquí, YOLOv6 de Meituan, MMDetection de OpenMMLab CN y PaddlePaddle de Baidu, Inc. se unieron a nosotros como YOLOv5 de Ultralytics para hablar de los proyectos de código abierto que permiten el futuro de la IA de visión.

Esta ha sido la primera vez que estos repositorios de inteligencia artificial han compartido escenario. Si te perdiste esta mesa redonda, puedes ver este vídeo en el que Bo Zhang, Glenn Jocher, Guanzhong Wang, Wenwei Zhang y Yixin Shi hablaron sobre su elección de marcos de trabajo, diseños, la evolución de la estructura de los repositorios y mucho más.

Como dice nuestro Director General, Glenn Jocher: "Todos pudimos aprender de las herramientas y experiencias de los demás".

La explosión de los datos visuales

Los sistemas de gestión de datos visuales presentan carencias en todos los aspectos: almacenamiento, calidad, búsqueda, análisis y visualización. Como consecuencia, las empresas y los investigadores pierden fiabilidad en sus productos, horas de trabajo, almacenamiento e informática y, lo que es más importante, la capacidad de aprovechar todo el potencial de sus datos.

En esta charla, el Dr. Danny Bickson nos enseñó a resolver este problema con su popular herramienta gratuita de GitHub, Fastdup.

FastDup es una herramienta para obtener información de una gran colección de imágenes. Puede encontrar anomalías, imágenes duplicadas y casi duplicadas, grupos de similitud y aprender el comportamiento normal y las interacciones temporales entre imágenes. Puede utilizarse para el submuestreo inteligente de un conjunto de datos de mayor calidad, la eliminación de valores atípicos y la detección de novedades de nueva información que se enviará para su etiquetado.

Experto en análisis de big data y aprendizaje automático a gran escala, Danny Bickson cuenta con más de 15 años de experiencia en el sector de la alta tecnología. Puede que lo conozcas por Turi, una plataforma de aprendizaje automático que crea productos de análisis de big data para sus usuarios. En 2016, Turi fue adquirida por Apple, donde el Dr. Danny Bickson trabajó como director sénior de ciencia de datos durante varios años.

Su puerta de entrada a la IA Vision

Por último, nos complace anunciar formalmente el lanzamiento de nuestro HUB de Ultralytics.

Ultralytics HUB es nuestra solución sin código para entrenar y desplegar modelos de IA en tres sencillos pasos. Dé vida a sus modelos eligiendo los datos con los que aprenderán.

Nuestros expertos, y creadores de las herramientas, Kalen Michael y Sergio Sánchez, nos dieron un paseo por Ultralytics HUB y nos explicaron todas las características y funcionalidades ¡Aprenda más sobre Ultralytics HUB y empiece a crear sus modelos gratis!


Encuentre todas las sesiones grabadas en nuestro canal de YouTube.

Estamos encantados con la participación en YOLO VISION y de crear un evento al que puedan asistir expertos de todo el mundo para aprender sobre la IA visual. Nos vemos el año que viene en YOLO VISION 2023.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles