Optimizando la anotación de imágenes con Ultralytics Platform
Aprende todo lo que necesitas saber sobre la anotación de imágenes con Ultralytics Platform y sus herramientas integradas para etiquetar datasets, gestionar anotaciones y preparar datos para modelos.

Ultralytics presentó recientemente Ultralytics Platform, un entorno diseñado para dar soporte a todo el ciclo de vida del desarrollo de visión artificial. La plataforma centraliza las herramientas utilizadas para gestionar las diversas etapas de los flujos de trabajo de IA visual, lo que incluye la preparación de datasets, la anotación de imágenes y vídeos, el entrenamiento de modelos y el despliegue.
A pesar de la creciente adopción en sectores como la conducción autónoma y la atención sanitaria, la creación de soluciones de computer vision todavía puede percibirse como un proceso fragmentado. Una de las razones principales es que los modelos de computer vision dependen en gran medida de la calidad de los datos con los que se entrenan. Antes incluso de que comience el entrenamiento, los datasets deben crearse, organizarse, revisarse y etiquetarse para que el modelo pueda aprender qué detectar o reconocer.
Cuando trabajas con datos visuales, este proceso se denomina anotación de datos o anotación de imágenes. Durante la anotación de imágenes, se marcan partes específicas de una imagen y se les asignan etiquetas que guían al modelo durante el entrenamiento.
Por ejemplo, si el objetivo es detectar perros en imágenes, los anotadores pueden dibujar cajas delimitadoras alrededor de cada perro para mostrar dónde aparecen. En tareas más detalladas, pueden perfilar la forma del perro utilizando máscaras de segmentación o marcar puntos clave para capturar su postura. Estos ejemplos etiquetados influyen directamente en el rendimiento del modelo una vez desplegado.
Gestionar flujos de trabajo de anotación de imágenes a escala puede ser complejo. Los grandes datasets a menudo requieren estándares de etiquetado coherentes, colaboración entre varios anotadores y herramientas que faciliten la revisión y el refinamiento de las anotaciones.
Ultralytics Platform reúne todo esto con un editor de anotaciones integrado. Admite varios tipos de tareas de anotación y ofrece a los equipos una forma más sencilla de etiquetar datos y preparar datasets de computer vision dentro de un único flujo de trabajo.

Fig 1. Un vistazo al editor de anotaciones en Ultralytics Platform (Fuente)
En este artículo, exploraremos cómo el editor de anotaciones de Ultralytics Platform ayuda a los equipos a anotar datasets de forma eficiente y optimiza la preparación de datos. ¡Empecemos!
Link to this sectionAnotación de datos en computer vision#
Antes de explorar las herramientas de anotación de imágenes disponibles en Ultralytics Platform, demos un paso atrás para comprender qué es la anotación de datos y por qué es importante en la creación de sistemas de computer vision.
Los modelos de computer vision aprenden analizando grandes colecciones de imágenes o vídeos conocidos como datasets. Sin embargo, las imágenes en bruto por sí solas no proporcionan suficiente información para que un modelo comprenda lo que debe detectar o reconocer. Para que los datos sean útiles para el entrenamiento, las imágenes deben etiquetarse mediante el etiquetado de datos para que el modelo pueda aprender qué objetos, formas o patrones buscar.
Durante la anotación de imágenes, se marcan elementos específicos dentro de una imagen y se les asignan etiquetas que describen lo que el modelo debe aprender. Estos ejemplos etiquetados guían a los modelos de deep learning y a los algoritmos durante el entrenamiento y les ayudan a reconocer patrones similares al procesar nuevas imágenes.
Las diferentes tareas de computer vision requieren distintos tipos de anotación de imágenes en función de la aplicación y el caso de uso. Por ejemplo, los anotadores pueden dibujar cajas delimitadoras alrededor de los objetos para la detección de objetos, perfilar regiones en una imagen para la segmentación semántica, definir puntos clave para la estimación de poses o asignar etiquetas a toda una imagen para su clasificación.
Link to this sectionGestión y preparación de datos#
Preparar datos para proyectos de computer vision suele implicar trabajar con diversos formatos de archivo y organizar datasets. También incluye garantizar que todo esté listo para la anotación y el entrenamiento de algoritmos de machine learning. En muchos flujos de trabajo, este proceso se reparte entre varias herramientas, donde los datos se cargan, se limpian y se trasladan entre sistemas antes de poder utilizarlos.
Ultralytics Platform simplifica esto al gestionar la preparación de datos, el entrenamiento de modelos y el despliegue dentro de un mismo entorno. Los equipos pueden cargar imágenes, vídeos o archivos de datasets y beneficiarse de un enfoque totalmente personalizable para preparar sus datos con anotaciones manuales o automatizadas mediante IA. Ultralytics Platform admite tanto datos en bruto como formatos estándar como YOLO y COCO, lo que facilita el inicio de nuevos proyectos. También proporciona acceso a datasets existentes en la plataforma, incluidos datasets anotados que los equipos pueden utilizar para iniciar rápidamente nuevos proyectos o experimentos.

Fig 2. Carga y gestiona datasets en un único entorno en la Ultralytics Platform. (Fuente)
Una vez que los datos están disponibles, se pueden gestionar directamente en la plataforma. Los desarrolladores pueden revisar imágenes, supervisar el progreso de la anotación y utilizar visualizaciones integradas para entender la distribución del dataset e identificar posibles lagunas.
La plataforma también admite el versionado de datasets, lo que ayuda a los equipos a capturar instantáneas de sus datos a medida que evolucionan. Esto facilita el seguimiento de los cambios, la comparación de experimentos y el mantenimiento de la coherencia durante el entrenamiento.
Con los datos preparados, los equipos pueden pasar a anotar las imágenes, donde se etiquetan para ayudar a los modelos a aprender qué detectar.
Link to this sectionAnotación de datasets en Ultralytics Platform#
Una vez cargados los datos, el siguiente paso es la anotación. Aquí es donde se etiquetan los datos de las imágenes, sentando las bases para entrenar modelos de computer vision. Ultralytics Platform incluye servicios integrados de anotación de imágenes a través de un editor de anotaciones que permite a los equipos etiquetar y gestionar datasets directamente en el mismo entorno.
El editor de anotaciones se despliega en un espacio de trabajo sencillo donde los usuarios pueden revisar imágenes, añadir etiquetas y actualizar las anotaciones según sea necesario. Todo está organizado en un solo lugar, lo que facilita mantener los datasets coherentes y listos para el entrenamiento de datos.
Los equipos pueden cargar datasets y empezar a etiquetar imágenes directamente en el navegador, definiendo y gestionando clases de anotación para garantizar que las etiquetas sigan siendo coherentes en todo el dataset. A medida que se crean las anotaciones, los usuarios pueden revisarlas visualmente en el editor, lo que facilita la comprobación de la precisión antes de pasar al entrenamiento del modelo.
Link to this sectionHerramientas de anotación de imágenes en Ultralytics Platform#
Ultralytics Platform también incluye varias capacidades que admiten flujos de trabajo eficientes de etiquetado de datasets, simplificando el proceso de anotación mediante algoritmos avanzados.
Aquí tienes algunas de las características clave disponibles en Ultralytics Platform:
- Anotación manual: Este enfoque permite a los usuarios tener un control y flexibilidad total al crear anotaciones de imágenes, como cajas delimitadoras, regiones de segmentación o puntos clave, directamente sobre las imágenes.
- Etiquetado asistido por IA: Esta función genera automáticamente sugerencias de anotación, reduciendo la necesidad de etiquetado manual. Utiliza SAM (Segment Anything Model) para detectar objetos o regiones con un solo clic, lo que agiliza el proceso de anotación y ayuda a los usuarios a revisar y confirmar las sugerencias antes de añadirlas al dataset.
- Edición de anotaciones: En cualquier momento, los usuarios pueden modificar o refinar las anotaciones de las imágenes después de haberlas creado. Esto ayuda a corregir errores de etiquetado y a mantener etiquetas de dataset coherentes durante todo el proceso de anotación.
- Gestión de clases: Los equipos y los desarrolladores individuales pueden definir y organizar las clases de anotación utilizadas durante el etiquetado de datasets. Esto ayuda a mantener las etiquetas coherentes en todas las imágenes, lo cual es importante para entrenar modelos que puedan reconocer y diferenciar con precisión entre clases.
Al combinar herramientas manuales, inteligencia artificial y automatización, Ultralytics Platform ayuda a los usuarios a anotar imágenes de manera más eficiente. También permite la preparación de datos de entrenamiento de alta calidad para modelos de computer vision escalables.
Link to this sectionTipos de tareas de anotación admitidas#
Los diferentes casos de uso, como el control de calidad de productos, requerirán distintos tipos de anotación en función de lo que deba detectarse en las imágenes o vídeos. Como hemos mencionado anteriormente, Ultralytics Platform admite cinco tareas de detección de objetos, cada una con su propio tipo de anotación.
Echemos un vistazo más de cerca a las tareas de anotación admitidas en la plataforma y cómo pueden utilizarse para etiquetar datasets.
Link to this sectionDetección de objetos#
La detección de objetos identifica y localiza objetos dentro de una imagen. Los anotadores marcan cada objeto de interés utilizando cajas delimitadoras, indicando dónde aparecen los elementos en la imagen.
En el editor de anotaciones, esto se hace utilizando la herramienta de caja delimitadora. Los usuarios pueden entrar en el “modo de edición”, hacer clic y arrastrar para dibujar un rectángulo alrededor de un objeto y asignar una etiqueta de clase desde un menú desplegable.
Las cajas delimitadoras pueden ajustarse después de haber sido creadas. Los anotadores pueden cambiar su tamaño arrastrando las esquinas o los tiradores de los bordes, moverlas arrastrando el centro de la caja o eliminarlas utilizando atajos de teclado. Estas anotaciones ayudan a los modelos de visión a aprender a detectar objetos en diferentes escenas y condiciones.

Fig 3. Anotación de detección de objetos utilizando cajas delimitadoras en la Ultralytics Platform. (Fuente)
Link to this sectionSegmentación de instancias#
La segmentación de instancias proporciona anotaciones más detalladas al definir la forma exacta de los objetos dentro de una imagen. En lugar de dibujar una simple caja, los anotadores trazan los límites del objeto utilizando una anotación poligonal para crear máscaras precisas para tareas de segmentación de imágenes.
El editor de anotaciones incluye una herramienta poligonal para esta tarea. Los anotadores colocan múltiples vértices alrededor de los bordes de un objeto para perfilar su forma. Una vez colocados los vértices, se puede cerrar el polígono para crear una máscara de segmentación.
Los vértices se pueden ajustar después de crear el polígono. Se pueden mover puntos individuales para refinar los límites del objeto y se pueden eliminar vértices si es necesario. Estas anotaciones a nivel de píxel ayudan a los modelos a aprender estructuras visuales detalladas y a distinguir entre objetos que aparecen cerca unos de otros.
Link to this sectionEstimación de pose#
Las anotaciones de estimación de poses capturan las posiciones de las articulaciones del cuerpo y las relaciones entre ellas. Esto ayuda a los modelos a comprender la estructura y el movimiento de personas o animales en una imagen.
Utilizando la herramienta de puntos clave, los anotadores colocan puntos clave que representan las articulaciones del cuerpo, como hombros, codos, muñecas, caderas, rodillas y tobillos. La plataforma admite varias plantillas de esqueleto integradas, incluido el formato de pose humana COCO de 17 puntos, así como plantillas para manos, caras, perros y esquinas de cajas.
Las plantillas permiten colocar un diseño completo de esqueleto con un solo clic, tras lo cual se pueden ajustar los puntos clave individuales para que coincidan con la pose de la imagen. Cada punto clave también puede incluir un indicador de visibilidad para señalar si es visible u está ocluido.

Fig 4. Anotación de estimación de pose utilizando puntos clave y plantillas de esqueleto. (Fuente)
Link to this sectionCajas delimitadoras orientadas (OBB)#
Las cajas delimitadoras orientadas llevan a las cajas delimitadoras tradicionales un paso más allá al admitir la rotación. Este tipo de anotación es útil cuando los objetos aparecen en ángulo en lugar de estar alineados con el marco de la imagen.
En el editor de anotaciones, los anotadores pueden utilizar la herramienta de caja delimitadora orientada para dibujar rectángulos rotados alrededor de los objetos. Después de dibujar la caja inicial, se puede utilizar un tirador de rotación para ajustar el ángulo, mientras que los tiradores de las esquinas permiten redimensionar la caja.
Las anotaciones rotadas se utilizan a menudo en imágenes aéreas, datasets de inspección industrial y otros escenarios donde los objetos aparecen en diagonal o desde diferentes puntos de vista.

Fig 5. Anotación de caja delimitadora orientada (OBB) para objetos rotados en imágenes aéreas. (Fuente)
Link to this sectionClasificación de imágenes#
La clasificación de imágenes asigna una etiqueta a toda una imagen en lugar de marcar objetos individuales dentro de ella.
Para los datasets de clasificación, el editor de anotaciones proporciona un panel selector de clases. Los anotadores pueden asignar etiquetas a las imágenes seleccionando una clase de la barra lateral o utilizando atajos de teclado para un etiquetado más rápido.
Estas etiquetas a nivel de imagen ayudan a los modelos a aprender patrones visuales de alto nivel que representan diferentes categorías.
Link to this sectionAnotación asistida por IA con SAM#
Etiquetar imágenes para tareas como la segmentación a menudo requiere un trabajo cuidadoso y detallado, especialmente cuando los objetos deben perfilarse con precisión. Ultralytics Platform incluye herramientas de anotación asistidas por IA que aceleran el proceso manteniendo las anotaciones precisas y fáciles de revisar.
Por ejemplo, los anotadores pueden interactuar con una imagen haciendo clic en partes de un objeto que desean incluir en la anotación. También pueden marcar áreas que deban excluirse para refinar el resultado. Basándose en estas entradas, el modelo genera una máscara de segmentación en tiempo real, que luego puede revisarse y ajustarse antes de guardarse.
Este enfoque facilita el trabajo con imágenes complejas sin necesidad de trazar manualmente cada detalle. Al mismo tiempo, los anotadores mantienen el control del resultado final, garantizando que las anotaciones sigan siendo coherentes en todo el dataset.

Fig 6. Segmentación asistida por IA utilizando la herramienta de anotación inteligente en la Ultralytics Platform. (Fuente)
Estas funciones están impulsadas por los Segment Anything Models (SAM). Estos modelos forman parte de un ecosistema más amplio de herramientas de computer vision de código abierto diseñadas para generar segmentaciones de alta calidad a partir de una entrada mínima. La plataforma admite múltiples variantes de SAM, incluidas SAM 2.1 y SAM 3. Esto da a los equipos la flexibilidad de elegir entre un rendimiento más rápido y resultados más detallados en función de sus necesidades.
Estas herramientas asistidas por IA pueden aplicarse en tareas como la detección de objetos, la segmentación de instancias y la detección de cajas delimitadoras orientadas. Esto significa que los equipos pueden procesar grandes datasets de forma más eficiente manteniendo la calidad necesaria para un entrenamiento de modelos fiable.
Link to this sectionMejora de los flujos de trabajo de anotación con herramientas integradas#
A medida que avanza el trabajo de anotación, es habitual volver atrás para ajustar etiquetas, corregir errores o revisar las imágenes más de cerca. El editor de anotaciones de Ultralytics incluye herramientas integradas que hacen que estas tareas cotidianas sean más fáciles de manejar y consuman menos tiempo.
Algunas de las funciones de flujo de trabajo disponibles en el editor incluyen:
- Atajos de teclado: El editor incluye atajos que agilizan acciones comunes, como guardar anotaciones, deshacer o rehacer cambios, eliminar etiquetas y seleccionar clases mientras se anota.
- Historial de deshacer y rehacer: Los anotadores pueden revertir o restaurar fácilmente los cambios realizados durante una sesión de edición. Esto ayuda a los equipos a experimentar con anotaciones y a corregir rápidamente los errores sin perder el progreso, favoreciendo un mejor control de calidad durante la preparación del dataset.
- Edición flexible de anotaciones: Las anotaciones pueden ajustarse incluso después de haber sido creadas. Los usuarios pueden cambiar el tamaño de las formas, mover anotaciones, rotar cajas delimitadoras orientadas o actualizar etiquetas de clase según sea necesario, especialmente al refinar objetos con formas irregulares.
- Controles de visibilidad: El editor incluye botones de visibilidad que permiten a los usuarios mostrar u ocultar anotaciones y etiquetas de clase, lo que facilita la inspección de imágenes durante el etiquetado.
- Herramientas de precisión: Funciones como el zoom y un cursor en forma de cruz con coordenadas de píxeles ayudan a los anotadores a colocar etiquetas con mayor precisión cuando trabajan con imágenes detalladas.
Link to this sectionGestión de clases de anotación en Ultralytics Platform#
Unas clases de anotación claras y coherentes desempeñan un papel importante en la creación de datasets de computer vision fiables. A medida que crecen los proyectos, gestionar el etiquetado de datos en grandes datasets puede resultar difícil, especialmente cuando hay varios anotadores implicados. Mantener las clases bien organizadas ayuda a garantizar que las anotaciones sigan siendo coherentes y que los modelos aprendan a partir de datos estructurados.
Ultralytics Platform simplifica este proceso integrando la gestión de clases directamente en el editor de anotaciones. En lugar de gestionar las etiquetas por separado, los equipos pueden crear, actualizar y revisar clases mientras trabajan en las imágenes, lo que facilita mantener la coherencia en todo el flujo de trabajo de anotación.
Dentro del editor, todas las clases están disponibles en una barra lateral junto al lienzo de anotación. Esto facilita la selección de la etiqueta correcta mientras se anota y el seguimiento de cómo se utilizan las clases en todo el dataset. Los usuarios pueden buscar clases existentes o crear otras nuevas según sea necesario, sin interrumpir su flujo de trabajo.
Los detalles de la clase también pueden actualizarse en cualquier momento. Los nombres pueden editarse directamente y se pueden asignar colores para que sea más fácil identificar las diferentes clases en las anotaciones. El editor también muestra cuántas anotaciones están vinculadas a cada clase y permite a los usuarios revisarlas, ayudando a los equipos a comprobar la coherencia y la precisión.
Todas las clases se gestionan a través de una tabla centralizada donde se pueden ordenar, buscar y actualizar. Cualquier cambio realizado aquí se aplica automáticamente en todo el dataset, ayudando a los equipos a mantener la coherencia a medida que escalan los proyectos de anotación.

Fig 7. La gestión de clases en el editor de anotaciones muestra la organización de etiquetas y la personalización de colores. (Fuente)
Link to this sectionCómo afecta la calidad de la anotación al rendimiento en el mundo real#
A medida que los sistemas de computer vision pasan del desarrollo al uso en el mundo real, la calidad de los datos anotados desempeña un papel clave en el rendimiento de los modelos. Los datasets bien etiquetados ayudan a los modelos a producir predicciones más precisas y coherentes, especialmente en entornos dinámicos o impredecibles.
En la práctica, incluso pequeñas incoherencias en la anotación pueden afectar al comportamiento del modelo. Las diferencias en la forma en que se etiquetan los objetos o cómo se manejan los casos límite pueden no ser obvias durante el entrenamiento, pero pueden conducir a predicciones menos fiables una vez que los sistemas se despliegan.
Además, estas incoherencias pueden ser más notables en aplicaciones del mundo real. Por ejemplo, en los sistemas de robótica y asistencia sanitaria, los modelos dependen de entradas visuales para detectar objetos y guiar acciones en tiempo real. Las variaciones en el etiquetado pueden influir en la precisión con la que estos sistemas interpretan su entorno.
Al mantener prácticas de anotación coherentes y utilizar plataformas como Ultralytics para gestionar y refinar datasets con el tiempo, los equipos pueden crear modelos que funcionen de forma más fiable más allá de los entornos de prueba controlados.
Link to this sectionConclusiones clave#
La anotación de datos de alta calidad es esencial para entrenar modelos precisos de computer vision y respaldar proyectos exitosos de anotación de imágenes. Ultralytics Platform simplifica este proceso con un potente editor de anotaciones que admite múltiples tareas de visión. Al combinar herramientas de anotación manual con etiquetado asistido por IA utilizando SAM y funciones de flujo de trabajo integradas, los equipos pueden preparar datasets de forma más eficiente y avanzar más rápido desde la preparación de datos hasta el desarrollo del modelo.
Únete a nuestra comunidad y explora el repositorio de GitHub para aprender más sobre los modelos de computer vision. Lee sobre aplicaciones como IA en automoción y computer vision en robótica en nuestras páginas de soluciones. Consulta nuestras opciones de licencia y empieza a crear tu propio modelo de IA visual.






