Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Подробный анализ обнаружения таблеток с использованием Ultralytics YOLO11

Абирами Вина

5 мин чтения

24 апреля 2025 г.

В этом руководстве по кодированию вы узнаете, как обнаруживать таблетки с помощью YOLO11 и набора данных Medical-Pills Dataset. Также изучите его потенциальные приложения и преимущества.

Искусственный интеллект используется почти во всех отраслях, но его влияние на здравоохранение, особенно в фармацевтике, особенно велико. В этом году объем рынка ИИ в фармацевтике оценивается в 1,94 миллиарда долларов, и ожидается, что к 2034 году он вырастет до 16,49 миллиарда долларов. 

Ключевым технологическим драйвером этого рынка является компьютерное зрение. В отличие от традиционной обработки изображений, компьютерное зрение - это подобласть ИИ, которая позволяет машинам понимать и анализировать визуальные данные в режиме реального времени. 

Рис. 1. Обзор применения ИИ на фармацевтическом рынке.

В фармацевтической промышленности, где даже малейшая ошибка может иметь серьезные последствия, Vision AI предлагает новые и надежные способы повышения безопасности и точности.  

Например, Ultralytics YOLO11 — это модель компьютерного зрения, разработанная для задач, выполняемых в реальном времени, таких как обнаружение объектов и сегментация экземпляров, и ее можно использовать для таких приложений, как идентификация таблеток или обнаружение дефектов в медицинской упаковке. 

В этой статье мы расскажем, как получить практический опыт работы с Vision AI, обучив YOLO11 обнаруживать таблетки. Мы также рассмотрим ее реальные приложения. Давайте начнем!

Создание AI модели для обнаружения таблеток

Прежде чем мы углубимся в то, как можно обучить YOLO11 для обнаружения таблеток, давайте сделаем шаг назад и поймем, что значит обучить модель и какова роль набора данных. 

Обучение модели включает в себя обучение ее распознаванию закономерностей путем показа ей множества примеров. В этом случае набор данных представляет собой коллекцию изображений, где каждое изображение помечено, чтобы указать, где находятся таблетки. Этот процесс помогает модели учиться на этих примерах, чтобы впоследствии она могла идентифицировать таблетки на новых изображениях.

Пакет Ultralytics Python еще больше упрощает этот процесс, поддерживая широкий спектр наборов данных в оптимизированном формате файлов YOLO. Они предлагают беспрепятственный доступ к популярным наборам данных и обеспечивают поддержку таких приложений, как обнаружение таблеток. 

Например, набор данных Medical Pills Dataset представляет собой специализированную концептуальную коллекцию, разработанную для демонстрации того, как обнаружение объектов может улучшить фармацевтические рабочие процессы посредством таких задач, как контроль качества, сортировка и выявление подделок.

Выбор среды разработки

Еще один фактор, который следует учитывать, прежде чем начать обучение с помощью пакета Ultralytics Python, — это выбор правильной среды разработки. Вот три популярных варианта:

  • Интерфейс командной строки (CLI): CLI или терминал — это простой текстовый инструмент, в котором вы можете вводить команды для запуска кода и взаимодействия с компьютером.

  • Jupyter Notebooks: Это более интерактивная среда, в которой можно писать и запускать код небольшими блоками (ячейками), что упрощает тестирование и отладку в процессе работы.

  • Google Colab: Облачный вариант, который работает как Jupyter Notebooks, но с дополнительным бонусом в виде бесплатного доступа к GPU, поэтому вам не нужно беспокоиться о локальной настройке.

Существуют и другие варианты настройки, которые вы можете изучить в официальной документации Ultralytics, но три упомянутых выше просты в настройке и использовании, что делает их отличным выбором для быстрого начала работы.

В этом руководстве мы сосредоточимся на том, как настроить и обучить YOLO11 с помощью Google Colab, Jupyter Notebooks или базового скрипта Python, поскольку процесс довольно схож в каждой из этих сред.

Кроме того, этот учебник очень похож на тот, который мы ранее рассматривали по обнаружению диких животных с помощью YOLO11. Если вам интересно узнать больше о каких-либо шагах в этом учебнике по кодированию, вы можете ознакомиться с ним.

Изучение набора данных для обнаружения таблеток в реальном времени с помощью YOLO

Набор данных Medical Pills Dataset включает 92 обучающих изображения и 23 изображения для валидации, что обеспечивает надежное разделение для построения и тестирования вашей модели. Обучающие изображения используются для обучения модели, а изображения для валидации помогают оценить, насколько хорошо модель работает на новых, ранее не виденных данных. 

Каждое изображение в наборе данных помечено для одного класса — таблетки. Аннотации ограничивающей рамки четко обозначают местоположение каждой таблетки, что делает набор данных идеальным для целенаправленных задач, таких как обнаружение таблеток, без сложностей, связанных с обработкой нескольких классов объектов.

Рис. 2. Краткий обзор набора данных Medical Pills.

Для поддержки обучения с помощью YOLO11 Ultralytics предоставляет файл конфигурации YAML, который определяет ключевые параметры, такие как пути к файлам, имена классов и метаданные, необходимые для обучения модели. Независимо от того, выполняете ли вы тонкую настройку предварительно обученной модели или начинаете с нуля, этот файл значительно упрощает процесс и помогает быстро приступить к работе.

Обучите модель Ultralytics YOLO на наборе данных о таблетках

Для начала мы настроим среду для обучения и тестирования модели. Вы можете использовать Google Colab, Jupyter Notebooks или простой файл Python в зависимости от ваших предпочтений. Просто создайте новый блокнот или файл Python в выбранной вами среде.

Затем мы можем настроить нашу среду и установить Python-пакет Ultralytics, используя команду, показанную ниже. Если вы используете среду на основе блокнота (Google Colab или Jupyter), запустите следующую команду с восклицательным знаком (!) в начале.

pip install ultralytics

После установки следующим шагом является загрузка и обучение YOLO11 с использованием набора данных Medical Pills. Поскольку набор данных поддерживается пакетом Ultralytics Python, процесс прост. 

Понимание процесса обучения модели

Сначала мы можем импортировать класс YOLO из пакета Ultralytics. Затем мы можем загрузить предварительно обученную модель YOLO11 из файла “yolo11n.pt”, что рекомендуется, поскольку это нано-модель и она имеет небольшой вес. 

Наконец, мы можем начать процесс обучения, указав модели на нашу конфигурацию набора данных (medical-pills.yaml) и установив количество эпох обучения (один полный проход по всему набору данных) равным 100, как показано ниже.

from ultralytics import YOLO

model = YOLO("yolo11n.pt")

results = model.train(data="medical-pills.yaml", epochs=100)

Обучение в течение нескольких эпох позволяет модели учиться и улучшать свою производительность с каждым проходом. Вы сможете найти журналы и контрольные точки, сохраненные в подпапке “runs/train/”, которые можно использовать для отслеживания прогресса и анализа производительности модели.

После завершения обучения пользовательская модель YOLO11 должна точно идентифицировать таблетки. Вы можете найти веса окончательной обученной модели в подпапке “runs/detect/train/weights/” под именем “best.pt”.

Оценка YOLO11 после обучения модели

Чтобы оценить, насколько хорошо модель научилась обнаруживать таблетки, мы можем выполнить валидацию следующим образом:

metrics = model.val()

Этот процесс возвращает общие метрики обнаружения объектов, которые дают представление об эффективности модели. Вот более подробный взгляд на некоторые из этих метрик:

  • Точность: Она измеряет долю таблеток, обнаруженных моделью, которые являются правильными.
  • Полнота (Recall): Показывает долю фактически существующих таблеток, которые модель успешно идентифицирует.
  • Средняя точность (mAP): Эта метрика объединяет точность и полноту по различным порогам обнаружения, чтобы дать общую оценку производительности.

Вместе эти метрики предлагают всестороннее представление о том, насколько точно модель обнаруживает таблетки в новых, невиданных данных. 

Если ваша модель работает не так хорошо, как ожидалось, вы можете попробовать обучить ее большему количеству эпох или точно настроить другие параметры обучения, такие как скорость обучения, которая контролирует размер шагов, предпринимаемых во время оптимизации модели, или размер изображения, чтобы еще больше улучшить ее производительность.

Запуск инференсов с использованием вашей пользовательской модели YOLO11

После того как модель YOLO11 обучена и оценена, следующим шагом является проверка того, насколько хорошо она работает на новых, ранее не виденных изображениях. Это помогает имитировать реальные условия, такие как обнаружение таблеток при различном освещении, расположении или стиле упаковки.

Чтобы протестировать модель, мы загрузили образец изображения с бесплатного стокового веб-сайта Pexels и проанализировали его или выполнили прогнозирование с использованием пользовательской модели YOLO11, как показано в фрагменте кода ниже. 

Вы можете использовать это примерное изображение или любое другое подходящее изображение, чтобы оценить, насколько хорошо модель работает в реальных сценариях. 

results = model.predict("path/to/image.jpg", save=True, conf=0.3)

Опция сохранения указывает модели сохранить выходное изображение, а настройка уверенности гарантирует, что в результаты будут включены только прогнозы с уверенностью не менее 30 процентов.

Когда вы запустите прогнозирование, в выходных данных отобразится сообщение, указывающее, где находится сохраненное изображение, например, "Результаты сохранены в runs/detect/train."

Ваше выходное изображение будет похоже на показанное здесь, с обнаруженными и выделенными ограничивающими рамками таблетками. Отображаемые оценки достоверности указывают на уровень уверенности для каждого обнаружения.

Рис. 3. Обнаружение таблеток с использованием YOLO11.

Реальные примеры использования YOLO11 в фармацевтике

Теперь, когда мы изучили, как обучать YOLO11 с использованием набора данных Medical-Pills и запускать инференс на изображениях для обнаружения таблеток, давайте рассмотрим реальные применения YOLO11 в фармацевтической промышленности.

Сортировка фармацевтических таблеток с помощью YOLO11

Автоматизированное обнаружение таблеток с помощью YOLO11 может применяться для сортировки фармацевтической продукции. Ручная сортировка часто является медленной, повторяющейся и подверженной ошибкам, которые могут поставить под угрозу безопасность и соответствие требованиям. 

Используя точно настроенную модель YOLO11, мы можем точно обнаруживать и сортировать таблетки на основе визуальных атрибутов, таких как размер, форма и цвет. Эта автоматизация ускоряет процесс и помогает обеспечить соответствие продукции строгим стандартам качества, что делает ее ценным инструментом в фармацевтической деятельности.

Рис. 4.  Обнаружение таблеток с помощью YOLO11.

Мониторинг инвентаря с помощью YOLO11

Своевременное наличие нужных лекарств — это больше, чем просто логистическая задача: это может повлиять на уход за пациентами и расходы. Нехватка критически важной таблетки может задержать лечение, а переизбыток может привести к истечению срока годности лекарств и напрасной трате запасов. Благодаря многочисленным типам таблеток и вариантам упаковки в фармацевтической промышленности автоматизированные системы инвентаризации могут обеспечить более точный учет.

Интеллектуальные системы инвентаризации могут использовать модели компьютерного зрения, такие как Ultralytics YOLO11, для мониторинга уровня запасов в режиме реального времени. Модель может сканировать полки и зоны упаковки, используя изображения или видео, для обнаружения и подсчета таблеток. По мере изменения уровня запасов, будь то добавление, удаление или перемещение товаров, система может автоматически обновлять подсчет.

Контроль качества фармацевтической продукции на основе YOLO11

В фармацевтическом производстве контроль качества имеет решающее значение для обеспечения безопасности и эффективности каждой таблетки. Даже незначительные дефекты, такие как трещина, неровная форма или небольшое изменение цвета, могут привести к ошибкам в дозировке или отзыву продукции. 

YOLO11 может помочь, автоматически обнаруживая таблетки, которые не соответствуют стандартам качества. Модель может изучать визуальные признаки и использовать ограничивающие рамки для отметки таких проблем, как сколы, выцветшие отпечатки или изменение цвета в режиме реального времени. Это позволяет своевременно удалять бракованные таблетки, сокращая отходы и гарантируя, что до пациентов доходят только лекарства с гарантированным качеством.

Кроме того, YOLO11 можно использовать для обнаружения и подсчета таблеток во время их проверки, для точного отслеживания при контроле качества. 

Рис. 5. YOLO11 можно использовать для обнаружения и подсчета капсул.

Плюсы и минусы использования Vision AI для обнаружения таблеток 

Теперь, когда мы рассмотрели, как Vision AI может применяться в фармацевтической промышленности, давайте кратко рассмотрим некоторые ключевые преимущества использования компьютерного зрения в этой отрасли:

  • Прогнозное обслуживание: YOLO11 можно использовать для обнаружения ранних признаков износа машины, выявляя несоответствия таблеток или упаковки. Это помогает планировать своевременный ремонт и предотвращает незапланированные простои производства.
  • Масштабируемое использование моделей: Модель можно дообучать на различных наборах данных для разных таблеток и упаковок. Это делает проверку масштабируемой и экономически эффективной по мере роста операций.
  • Удаленный мониторинг: Он обеспечивает проверку качества в реальном времени при интеграции с облачными системами и периферийными устройствами и идеально подходит для управления сельскими диспенсерами, автоматизированными установками и удаленными телеаптечными установками.

Несмотря на многочисленные преимущества внедрения Vision AI в фармацевтической промышленности, при использовании таких технологий следует учитывать и некоторые моменты: 

  • Интеграция в операционную деятельность: Интеграция систем ИИ в существующие рабочие процессы может потребовать корректировок, обучения и проверок совместимости с текущей инфраструктурой.
  • Соответствие нормативным требованиям: Автоматизированные системы должны соответствовать строгим нормативным стандартам для обеспечения безопасности пациентов и стабильного качества продукции.
  • Управление ошибками: Даже продвинутые модели могут выдавать ложноположительные или ложноотрицательные результаты. Важно иметь процессы для обработки и исправления этих ошибок.

Перспективы рабочих процессов AI в фармацевтике

В будущем ИИ, вероятно, будет играть большую роль в том, чтобы сделать клинические испытания быстрее, эффективнее и экономичнее. Он может помочь разработать более качественные протоколы испытаний, выбрать правильные группы пациентов и отслеживать данные в режиме реального времени. 

Это может позволить исследователям реагировать на проблемы по мере их возникновения, а не постфактум. ИИ также может ускорить процесс утверждения, сократив объем бумажной работы и автоматизировав рутинные проверки. В целом, интеграция ИИ в фармацевтические рабочие процессы может привести к сокращению задержек и более быстрому доступу к новым методам лечения.

Основные выводы

Обучение Ultralytics YOLO11 на наборе данных Medical Pills показывает, насколько быстро и эффективно модель может адаптироваться к фармацевтическим задачам. Даже с небольшим набором данных она может точно обнаруживать таблетки, что делает ее полезной для таких задач, как сортировка, контроль качества и отслеживание запасов.

По мере роста наборов данных и совершенствования моделей потенциал Vision AI в фармацевтике выходит за рамки просто логистики. Эта технология может также поддерживать клинические испытания, помогая в последовательной идентификации и отслеживании таблеток, а также помогая исследователям в безопасном тестировании новых комбинаций лекарств. 

Изучите наш репозиторий на GitHub, чтобы узнать больше и стать частью нашего растущего сообщества. Откройте для себя передовые инновации в различных секторах, от ИИ в сельском хозяйстве до компьютерного зрения в здравоохранении. Ознакомьтесь с нашими вариантами лицензирования и запустите свои проекты в области Vision AI уже сегодня.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена