En este tutorial de codificación, aprende a detectar píldoras utilizando YOLO11 con el Conjunto de Datos Médico-Píldoras. Además, explora sus posibles aplicaciones y ventajas.
La inteligencia artificial se está utilizando en casi todas las industrias, pero su influencia en la sanidad, especialmente en la farmacéutica, es especialmente sustancial. Este año, la IA en el mercado farmacéutico está valorada en 1.940 millones de dólares, y se espera que crezca hasta los 16.490 millones en 2034.
Un motor tecnológico clave de este mercado es la visión por ordenador. A diferencia del procesamiento de imágenes tradicional, la visión por ordenador es un subcampo de la IA que permite a las máquinas comprender y analizar datos visuales en tiempo real.
En la industria farmacéutica, donde hasta el más mínimo error puede tener graves consecuencias, Vision AI ofrece formas nuevas y fiables de mejorar la seguridad y la precisión.
Por ejemplo Ultralytics YOLO11 es un modelo de visión por ordenador diseñado para tareas en tiempo real como la detección de objetos y la segmentación de instancias, y puede utilizarse para aplicaciones como la identificación de píldoras o la detección de defectos en envases médicos.
En este artículo, veremos cómo ponerte manos a la obra con la IA de Visión entrenando a YOLO11 para que detecte píldoras. También exploraremos sus aplicaciones en el mundo real. ¡Vamos a empezar!
Antes de sumergirnos en cómo se puede entrenar YOLO11 para detectar píldoras, demos un paso atrás y comprendamos lo que significa entrenar un modelo y el papel de un conjunto de datos.
Entrenar un modelo consiste en enseñarle a reconocer patrones mostrándole muchos ejemplos. En este caso, un conjunto de datos es una colección de imágenes en la que cada imagen está etiquetada para indicar dónde se encuentran las pastillas. Este proceso ayuda al modelo a aprender de estos ejemplos para que más tarde pueda identificar píldoras en nuevas imágenes.
El paquetePython Ultralytics facilita aún más este proceso al admitir una amplia gama de conjuntos de datos en un formato de archivo YOLO racionalizado. Ofrecen un acceso sin complicaciones a los conjuntos de datos más populares y son compatibles con aplicaciones como la detección de píldoras.
Por ejemplo, el Conjunto de datos de píldoras médicas es una colección de prueba de concepto diseñada para mostrar cómo la detección de objetos puede mejorar los flujos de trabajo farmacéuticos mediante tareas como el control de calidad, la clasificación y la detección de falsificaciones.
Otro factor que debes tener en cuenta antes de empezar a formarte con el paquetePython Ultralytics es elegir el entorno de desarrollo adecuado. Aquí tienes tres opciones populares:
Hay otras opciones de configuración que puedes explorar en la documentación oficial Ultralytics , pero las tres mencionadas anteriormente son fáciles de configurar y utilizar, lo que las convierte en excelentes opciones para empezar rápidamente.
En esta guía, nos centraremos en cómo configurar y entrenar YOLO11 utilizando Google Colab, Jupyter Notebooks o un script básico Python , ya que el proceso es bastante similar en cada uno de estos entornos.
Además, este tutorial es bastante similar al que cubrimos anteriormente sobre la detección de fauna utilizando YOLO11. Si te interesan más detalles sobre alguno de los pasos de este tutorial de codificación, puedes consultarlo.
El conjunto de datos de píldoras médicas incluye 92 imágenes de entrenamiento y 23 imágenes de validación, lo que proporciona una división sólida tanto para construir como para probar tu modelo. Las imágenes de entrenamiento se utilizan para enseñar al modelo, mientras que las imágenes de validación ayudan a evaluar el rendimiento del modelo con datos nuevos y desconocidos.
Cada imagen del conjunto de datos está etiquetada para una sola clase, las píldoras. Las anotaciones de los recuadros delimitadores marcan claramente la ubicación de cada píldora, lo que hace que el conjunto de datos sea ideal para tareas específicas, como la detección de píldoras, sin la complejidad de manejar múltiples clases de objetos.
Para apoyar el entrenamiento con YOLO11, Ultralytics proporciona un archivo de configuración YAML que define parámetros clave como rutas de archivos, nombres de clases y metadatos necesarios para el entrenamiento del modelo. Tanto si estás ajustando un modelo preentrenado como si empiezas desde cero, este archivo simplifica mucho el proceso y te ayuda a empezar rápidamente.
Para empezar, configuraremos un entorno para entrenar y probar el modelo. Puedes optar por utilizar Google Colab, cuadernos Jupyter o un simple archivo Python , según prefieras. Sólo tienes que crear un nuevo cuaderno o archivo Python en el entorno que elijas.
A continuación, podemos configurar nuestro entorno e instalar el paquetePython Ultralytics mediante el comando que se muestra a continuación. Si utilizas un entorno basado en cuadernosGoogle Colab o Jupyter), ejecuta el siguiente comando con un signo de exclamación (!) al principio.
pip install ultralytics
Una vez instalado, el siguiente paso es descargar y entrenar YOLO11 utilizando el conjunto de datos Medical Pills. Como el conjunto de datos es compatible con el paquetePython Ultralytics , el proceso es sencillo.
En primer lugar, podemos importar la clase YOLO del paquete Ultralytics . Después, podemos cargar un modelo YOLO11 preentrenado del archivo "yolo11n.pt", que se recomienda porque es un modelo nano y ligero.
Por último, podemos iniciar el proceso de entrenamiento dirigiendo el modelo a la configuración de nuestro conjunto de datos (medical-pills.yaml) y estableciendo el número de épocas de entrenamiento (una pasada completa por todo el conjunto de datos) en 100, como se muestra a continuación.
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
results = model.train(data="medical-pills.yaml", epochs=100)
Entrenar durante varias épocas permite que el modelo aprenda y mejore su rendimiento con cada pasada. Podrás encontrar registros y puntos de control guardados en la subcarpeta "runs/train/", que puedes utilizar para controlar el progreso y revisar el rendimiento del modelo.
Una vez completado el entrenamiento, el modelo YOLO11 entrenado a medida debería ser capaz de identificar píldoras con precisión. Puedes buscar los pesos finales del modelo entrenado en la subcarpeta "runs/detect/train/weights/" con el nombre "best.pt".
Para evaluar lo bien que el modelo ha aprendido a detectar píldoras, podemos realizar la validación del siguiente modo:
metrics = model.val()
Este proceso devuelve métricas comunes de detección de objetos, que proporcionan información sobre el rendimiento del modelo. A continuación te mostramos algunas de estas métricas:
Juntas, estas métricas ofrecen una visión global de la precisión con la que el modelo detecta píldoras en datos nuevos y no vistos.
Si tu modelo no funciona tan bien como esperabas, puedes intentar entrenarlo durante más épocas o ajustar otros parámetros de entrenamiento, como la tasa de aprendizaje, que controla el tamaño de los pasos que se dan durante la optimización del modelo, o el tamaño de la imagen, para mejorar aún más su rendimiento.
Una vez entrenado y evaluado el modelo YOLO11 , el siguiente paso es comprobar su rendimiento con imágenes nuevas y desconocidas. Esto ayuda a simular las condiciones del mundo real, como la detección de píldoras con distinta iluminación, disposición o estilo de envasado.
Para probar el modelo, hemos descargado una imagen de muestra de Pexels, un sitio web gratuito de imágenes de archivo, y hemos analizado la imagen o ejecutado una predicción utilizando el modelo YOLO11 entrenado a medida, como se muestra en el fragmento de código siguiente.
Puedes utilizar esta imagen de muestra o cualquier otra imagen relevante para evaluar el rendimiento del modelo en situaciones reales.
results = model.predict("path/to/image.jpg", save=True, conf=0.3)
La opción Guardar indica al modelo que almacene la imagen de salida, y el ajuste Confianza se asegura de que sólo se incluyan en los resultados las predicciones con al menos un 30% de certeza.
Cuando ejecutes la predicción, la salida mostrará un mensaje que te indicará dónde se encuentra la imagen guardada; por ejemplo, "Resultados guardados en runs/detect/train".
Tu imagen de salida será similar a la que se muestra aquí, con píldoras detectadas y resaltadas mediante cuadros delimitadores. Las puntuaciones de confianza mostradas indican el nivel de certeza de cada detección.
Ahora que hemos explorado cómo entrenar a YOLO11utilizando el Conjunto de datos de píldoras médicas y ejecutar inferencias sobre imágenes para la detección de píldoras, echemos un vistazo a las aplicaciones reales de YOLO11en la industria farmacéutica.
La detección automatizada de píldoras con YOLO11 puede aplicarse a la clasificación farmacéutica. La clasificación manual suele ser lenta, repetitiva y propensa a errores que pueden comprometer la seguridad y el cumplimiento de los medicamentos.
Utilizando un modelo YOLO11 afinado, podemos detectar y clasificar píldoras con precisión basándonos en atributos visuales como el tamaño, la forma y el color. Esta automatización acelera el proceso y ayuda a garantizar que los productos cumplen estrictas normas de calidad, lo que la convierte en una valiosa herramienta en las operaciones farmacéuticas.
Almacenar la medicación adecuada a tiempo es algo más que una tarea logística: puede afectar a la atención al paciente y a los costes. Quedarse sin una pastilla crítica puede retrasar el tratamiento, mientras que un exceso de existencias puede dar lugar a medicamentos caducados y a un inventario desperdiciado. Con numerosos tipos de pastillas y variaciones de envases en la industria farmacéutica, los sistemas automatizados de inventario pueden permitir registros más precisos.
Los sistemas de inventario inteligentes pueden utilizar modelos de visión por ordenador como Ultralytics YOLO11 para controlar los niveles de existencias en tiempo real. El modelo puede escanear estanterías y zonas de embalaje mediante imágenes o vídeo para detectar y contar pastillas. A medida que cambian los niveles de existencias, ya se añadan, retiren o muevan artículos, el sistema puede actualizar el recuento automáticamente.
En la producción farmacéutica, el control de calidad es crucial para garantizar que cada pastilla sea segura y eficaz. Incluso pequeños defectos, como una grieta, una forma irregular o una ligera variación de color, pueden provocar errores de dosificación o la retirada del producto.
YOLO11 puede ayudar detectando automáticamente las píldoras que no cumplen las normas de calidad. El modelo puede aprender características visuales y utiliza cuadros delimitadores para señalar en tiempo real problemas como astillas, impresiones descoloridas o decoloración. Esto permite retirar pronto las pastillas defectuosas, reduciendo los residuos y garantizando que sólo llegue a los pacientes medicación de calidad asegurada.
Además, YOLO11 puede utilizarse para detectar y contar las píldoras a medida que se inspeccionan, para un seguimiento preciso mientras se controla la calidad.
Ahora que hemos explorado cómo puede aplicarse la IA de visión en la industria farmacéutica. Echemos un rápido vistazo a algunas de las principales ventajas de utilizar la visión por ordenador en este sector:
Aunque la aplicación de la IA Vision en la industria farmacéutica tiene muchas ventajas, también hay que tener en cuenta algunas consideraciones al utilizar estas tecnologías:
En el futuro, es probable que la IA desempeñe un papel más importante para que los ensayos clínicos sean más rápidos, inteligentes y rentables. Puede ayudar a diseñar mejores protocolos de ensayo, elegir los grupos de pacientes adecuados y controlar los datos en tiempo real.
Esto puede permitir a los investigadores responder a los problemas a medida que surgen, en lugar de hacerlo a posteriori. La IA también puede acelerar el proceso de aprobación reduciendo el papeleo manual y automatizando las comprobaciones rutinarias. En general, la integración de la IA en los flujos de trabajo farmacéuticos puede dar lugar a menos retrasos y a un acceso más rápido a los nuevos tratamientos.
El entrenamiento Ultralytics YOLO11 en el conjunto de datos de píldoras médicas muestra la rapidez y eficacia con que el modelo puede adaptarse a las tareas farmacéuticas. Incluso con un conjunto de datos pequeño, puede detectar píldoras con precisión, lo que lo hace útil para cosas como la clasificación, el control de calidad y el seguimiento de inventarios.
A medida que crecen los conjuntos de datos y mejoran los modelos, el potencial de la IA Vision en la industria farmacéutica va más allá de la logística. Esta tecnología también podría servir de apoyo a los ensayos clínicos, ayudando a identificar y rastrear píldoras de forma coherente, y ayudando a los investigadores a probar con seguridad nuevas combinaciones de fármacos.
Explora nuestro repositorio de GitHub para obtener más información y formar parte de nuestra creciente comunidad. Descubre innovaciones punteras en diversos sectores, desde la IA en la agricultura hasta la visión por ordenador en la sanidad. Echa un vistazo a nuestras opciones de licencia y lanza hoy mismo tus proyectos de Vision AI.
Comienza tu viaje con el futuro del aprendizaje automático