このコーディングチュートリアルでは、Medical-Pills Datasetを使用してYOLO11で錠剤を検出する方法を学びます。また、その潜在的なアプリケーションと利点についても探ります。

このコーディングチュートリアルでは、Medical-Pills Datasetを使用してYOLO11で錠剤を検出する方法を学びます。また、その潜在的なアプリケーションと利点についても探ります。
人工知能はほぼすべての産業で使用されていますが、医療、特に製薬におけるその影響は特に大きいものです。今年の製薬におけるAI市場は19億4000万ドルの価値があり、2034年までに164億9000万ドルに成長すると予想されています。
この市場の主要な技術的推進力はコンピュータビジョンです。従来の画像処理とは異なり、コンピュータビジョンはAIのサブフィールドであり、機械が視覚データをリアルタイムで理解および分析できるようにします。
ごくわずかなエラーでも重大な結果につながる可能性のある製薬業界において、Vision AIは安全性と精度を向上させるための新しい信頼性の高い方法を提供します。
たとえば、Ultralytics YOLO11は、物体検出やインスタンスセグメンテーションなどのリアルタイムタスク向けに設計されたコンピュータビジョンモデルであり、錠剤の識別や医薬品パッケージの欠陥検出などのアプリケーションに使用できます。
この記事では、YOLO11をトレーニングして錠剤を検出することにより、Vision AIを実際に体験する方法を説明します。また、その実際のアプリケーションについても検討します。さあ、始めましょう!
YOLO11をトレーニングして錠剤を検出する方法を詳しく説明する前に、一歩下がって、モデルをトレーニングすることの意味とデータセットの役割を理解しましょう。
モデルのトレーニングには、多くの例を示すことによってパターンを認識するように教えることが含まれます。この場合、データセットは、各画像に錠剤の場所を示すラベルが付けられた画像のコレクションです。このプロセスは、モデルがこれらの例から学習し、後で新しい画像で錠剤を識別できるようにするのに役立ちます。
Ultralytics Pythonパッケージは、合理化されたYOLOファイル形式で幅広いデータセットをサポートすることにより、このプロセスをさらに簡単にします。彼らは一般的なデータセットへの手間のかからないアクセスを提供し、錠剤検出などのアプリケーションをサポートします。
たとえば、Medical Pills Datasetは、物体検出が品質管理、選別、偽造検出などのタスクを通じて医薬品のワークフローをどのように改善できるかを示すように設計された、専用の概念実証コレクションです。
Ultralytics Pythonパッケージでトレーニングを開始する前に考慮すべきもう1つの要素は、適切な開発環境を選択することです。以下に3つの一般的なオプションを示します。
公式のUltralyticsドキュメントには、他にも検討できるセットアップオプションがありますが、上記3つはセットアップと使用が簡単で、すぐに始めるのに最適です。
このガイドでは、Google Colab、Jupyter Notebooks、または基本的なPythonスクリプトを使用してYOLO11をセットアップおよびトレーニングする方法に焦点を当てます。これは、これらの各環境でプロセスが非常に似ているためです。
また、このチュートリアルは、以前に取り上げたYOLO11を使用した野生生物の検出に関するチュートリアルと非常によく似ています。このコーディングチュートリアルのいずれかのステップの詳細に関心がある場合は、確認してください。
Medical Pills Dataset には、92 枚のトレーニング画像と 23 枚の検証画像が含まれており、モデルの構築とテストの両方に対応できる堅牢な分割を提供します。トレーニング画像はモデルを学習させるために使用され、検証画像はモデルが新しい、未知のデータに対してどの程度うまく機能するかを評価するのに役立ちます。
データセット内の各画像には、単一のクラス (錠剤) のラベルが付けられています。バウンディングボックスのアノテーションは、各錠剤の位置を明確に示しており、複数のオブジェクトクラスを処理する複雑さなしに、錠剤検出のような特定のタスクにデータセットを最適化します。
YOLO11 でのトレーニングをサポートするために、Ultralytics は、モデルのトレーニングに必要なファイルパス、クラス名、メタデータなどの主要なパラメータを定義するYAML 構成ファイルを提供しています。事前トレーニング済みのモデルを微調整する場合でも、ゼロから始める場合でも、このファイルを使用するとプロセスが大幅に簡素化され、迅速に開始できます。
まず、モデルのトレーニングとテストのための環境をセットアップします。Google Colab、Jupyter Notebook、またはお好みに応じてシンプルな Python ファイルを使用できます。選択した環境で新しいノートブックまたは Python ファイルを作成するだけです。
次に、以下のコマンドを使用して環境をセットアップし、Ultralytics Python パッケージをインストールします。ノートブックベースの環境 (Google Colab または Jupyter) を使用している場合は、先頭に感嘆符 (!) を付けて次のコマンドを実行してください。
pip install ultralytics
インストールが完了したら、次のステップは Medical Pills データセットを使用して YOLO11 をダウンロードしてトレーニングすることです。データセットは Ultralytics Python パッケージでサポートされているため、プロセスは簡単です。
まず、Ultralytics パッケージから YOLO クラスをインポートします。次に、ファイル「yolo11n.pt」から事前トレーニング済みの YOLO11 モデルをロードします。これは、ナノモデルで軽量であるため推奨されます。
最後に、モデルにデータセット構成 (medical-pills.yaml) を指定し、トレーニングエポック数 (データセット全体の 1 回の完全なパス) を以下に示すように 100 に設定して、トレーニングプロセスを開始できます。
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
results = model.train(data="medical-pills.yaml", epochs=100)
複数のエポックでトレーニングすることで、モデルは各パスで学習し、パフォーマンスを向上させることができます。進行状況を監視し、モデルのパフォーマンスを確認するために使用できる「runs/train/」サブフォルダーに保存されているログとチェックポイントを見つけることができます。
トレーニングが完了すると、カスタムトレーニングされた YOLO11 モデルは錠剤を正確に識別できるようになります。「runs/detect/train/weights/」サブフォルダーにある「best.pt」という名前で、最終的なトレーニング済みモデルの重みを確認できます。
モデルが錠剤を検出する方法をどれだけ学習したかを評価するために、次のように検証を実行できます。
metrics = model.val()
このプロセスは、一般的な物体検出の指標を返し、モデルのパフォーマンスに関する洞察を提供します。これらの指標のいくつかについて詳しく見てみましょう。
これらの指標を組み合わせることで、モデルが新しい、未知のデータで錠剤をどれだけ正確に検出するかを包括的に把握できます。
モデルのパフォーマンスが期待どおりでない場合は、より多くのエポックでトレーニングするか、モデルの最適化中に実行されるステップのサイズを制御する学習率や、パフォーマンスをさらに向上させるための画像サイズなど、他のトレーニングパラメータを微調整してみてください。
YOLO11 モデルのトレーニングと評価が完了したら、次のステップは、新しい、未知の画像でモデルがどれだけうまく機能するかをテストすることです。これは、さまざまな照明、配置、またはパッケージングスタイルで錠剤を検出するなど、実際の条件をシミュレートするのに役立ちます。
モデルをテストするために、無料のストック画像 Web サイトであるPexelsからサンプル画像をダウンロードし、以下のコードスニペットに示すように、カスタムトレーニングされた YOLO11 モデルを使用して画像を分析するか、予測を実行しました。
このサンプル画像、またはその他の関連画像を使用して、モデルが実際のシナリオでどの程度うまく機能するかを評価できます。
results = model.predict("path/to/image.jpg", save=True, conf=0.3)
saveオプションを使用すると、モデルは出力画像を保存し、confidence設定により、少なくとも30%の確実性を持つ予測のみが結果に含まれるようになります。
予測を実行すると、保存された画像の場所を示すメッセージ(たとえば、"Results saved to runs/detect/train")が出力に表示されます。
出力画像は、ここに示されている画像と同様になり、錠剤が検出され、バウンディングボックスを使用して強調表示されます。表示される信頼性スコアは、各検出の確実性のレベルを示します。
Medical-Pills Datasetを使用してYOLO11をトレーニングし、錠剤検出のために画像で推論を実行する方法を検討したので、製薬業界におけるYOLO11の実際のアプリケーションを見てみましょう。
YOLO11による自動錠剤検出は、医薬品の仕分けに適用できます。手動による仕分けは、多くの場合、時間がかかり、反復的で、薬の安全性とコンプライアンスを損なう可能性のあるエラーが発生しやすくなります。
微調整されたYOLO11モデルを使用することで、サイズ、形状、色などの視覚的属性に基づいて錠剤を正確に検出および仕分けできます。この自動化により、プロセスがスピードアップし、製品が厳格な品質基準を満たすことが保証され、製薬業務において貴重なツールとなります。
適切な薬を時間通りに在庫することは、単なるロジスティクス上のタスクではなく、患者のケアとコストに影響を与える可能性があります。重要な錠剤の在庫が不足すると、治療が遅れる可能性があり、過剰な在庫は期限切れの薬や無駄な在庫につながる可能性があります。製薬業界には多数の種類の錠剤とパッケージのバリエーションがあるため、自動化された在庫システムにより、より正確な記録が可能になります。
スマート在庫システムは、Ultralytics YOLO11のようなコンピュータビジョンモデルを使用して、在庫レベルをリアルタイムで監視できます。このモデルは、画像またはビデオを使用して棚とパッケージングエリアをスキャンし、錠剤を検出してカウントできます。アイテムが追加、削除、または移動された場合など、在庫レベルが変化すると、システムはカウントを自動的に更新できます。
医薬品の製造において、品質管理はすべての錠剤が安全で効果的であることを確認するために不可欠です。亀裂、不均一な形状、わずかな色の変化などのわずかな欠陥でも、投与量の間違いや製品のリコールにつながる可能性があります。
YOLO11は、品質基準を満たさない錠剤を自動的に検出することで役立ちます。このモデルは視覚的特徴を学習し、バウンディングボックスを使用して、チップ、かすれた刻印、または変色などの問題をリアルタイムで検出します。これにより、欠陥のある錠剤を早期に除去し、品質が保証された薬のみが患者に届くようにすることができます。
さらに、YOLO11を使用して、品質を監視しながら正確な追跡を行うために、検査時に錠剤を検出してカウントできます。
Vision AIが製薬業界でどのように応用できるかを見てきました。このセクターでコンピュータビジョンを使用する主な利点を見てみましょう。
製薬業界でVision AIを実装することには多くの利点がありますが、このようなテクノロジーを使用する際には留意すべき点もあります。
将来的には、AIが臨床試験をより迅速、スマート、かつ費用対効果の高いものにする上で、より大きな役割を果たす可能性があります。AIは、より優れた試験プロトコルの設計、適切な患者グループの選択、およびリアルタイムでのデータの監視に役立ちます。
これにより、研究者は事後ではなく、問題が発生したときに対応できるようになる可能性があります。また、AIは手作業による事務処理を削減し、ルーチンチェックを自動化することで、承認プロセスを迅速化できます。全体として、AIを医薬品ワークフローに統合することで、遅延が減り、新しい治療法へのアクセスが迅速化される可能性があります。
Medical Pills DatasetでUltralytics YOLO11をトレーニングすることで、このモデルがいかに迅速かつ効果的に製薬タスクに適応できるかがわかります。小さなデータセットでも、錠剤を正確に検出できるため、選別、品質管理、在庫追跡などに役立ちます。
データセットが拡大し、モデルが改善されるにつれて、製薬業界におけるVision AIの可能性は、単なるロジスティクスを超えて広がります。このテクノロジーは、一貫性のある錠剤の識別と追跡を支援し、研究者が新しい薬の組み合わせを安全にテストするのを支援することにより、臨床試験もサポートできます。
詳細については、GitHubリポジトリをご覧いただき、成長を続けるコミュニティにご参加ください。農業におけるAIからヘルスケアにおけるコンピュータビジョンまで、さまざまな分野の最先端のイノベーションをご覧ください。ライセンスオプションを確認して、今すぐVision AIプロジェクトを開始しましょう。