YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

ファイン・チューニング

Ultralytics YOLOのような機械学習モデルを特定のタスクに合わせて微調整します。手法、応用例、ベストプラクティスはこちらでご確認ください。

ファインチューニングは、大規模な汎用データセットで事前学習されたモデルを、より小規模で特殊なデータセットでさらにトレーニングする、機械学習(ML)における重要な手法です。このプロセスは、転移学習の一形態であり、モデルをゼロからトレーニングすることなく、特定のタスクで優れた成果を上げられるように、モデルが学習した知識を適応させます。強力な基盤モデルから始めることで、開発者は大幅に少ないデータと計算リソースで高いパフォーマンスを達成できます。この概念は、スタンフォードAI研究所などの研究機関でも研究されています。

ファインチューニングはどのように機能しますか?

プロセスは、ビジョンの場合はImageNetのような広範なデータセット、または大規模言語モデル(LLM)の場合は大規模なテキストコーパスで重みがすでに最適化されているモデルから始まります。この事前トレーニング済みのモデルは、画像のエッジやテクスチャ、またはテキストの文法やセマンティクスなど、一般的な特徴をすでに理解しています。次に、ファインチューニングはトレーニングプロセスを継続します。通常、より低い学習率を使用して、ターゲットアプリケーションに合わせて調整されたカスタムデータセットを使用します。これにより、モデルのパラメータが調整され、新しいタスクの特定のニュアンスに特化されます。PyTorchTensorFlowのようなフレームワークは、ファインチューニングワークフローを実装するための広範なツールを提供します。

実際のアプリケーション

ファインチューニングは、コンピュータビジョン(CV)自然言語処理(NLP)で広く使用されています。

  • 医用画像解析: Ultralytics YOLO11のようなモデルは、一般的な物体検出のためにCOCOデータセットで事前トレーニングされており、MRIスキャンの特殊なコレクションでファインチューニングして、腫瘍を正確に検出できます。このカスタマイズは、信頼性の高いヘルスケアAIソリューションを構築するために重要です。
  • カスタムチャットボット: 企業は、BERTのような強力なLLMを社内ドキュメントやカスタマーサポートログでファインチューニングできます。結果として得られるモデルは、自社の製品に関する専門家となり、非常に効果的でコンテキストを認識したチャットボットをWebサイトに提供できます。このようなモデルの多くは、Hugging Faceのようなプラットフォームで利用できます。

ファインチューニングと関連概念

ファインチューニングを他のモデル適応技術と区別することが重要です。

  • スクラッチからのトレーニング: これは、ニューラルネットワークをランダムな重みで初期化し、データセットでトレーニングすることを含みます。膨大な量のデータと計算能力(例:GPU)が必要であり、一般的に、事前トレーニングされたモデルを微調整するよりも効率が劣ります。
  • Parameter-Efficient Fine-Tuning (PEFT): PEFTは、ファインチューニングをよりリソース効率の高い方法で行うための手法の集合です。モデルのすべての重みを更新する代わりに、LoRAのようなPEFT技術は、元のモデルを凍結し、少数の新しいパラメータのみを学習させます。これにより、メモリとストレージの要件が大幅に削減され、Meta AIGoogleのような組織の大規模モデルをより簡単に適応させることができます。
  • プロンプトチューニング: 元のモデルの重みをすべて固定する特定のPEFT手法です。モデル自体を調整する代わりに、特定のタスクのためにモデルの出力を誘導する特別な「ソフトプロンプト」(学習可能な埋め込み)を学習します。
  • 検索拡張生成(RAG): この手法は、トレーニングを通じてモデルの重みを変更するのではなく、推論時に外部知識を提供することでモデルの出力を強化します。RAGは、データベースから関連情報を取得し、プロンプトに追加して、より正確で最新の応答を生成します。

Ultralyticsでのファインチューニング

Ultralyticsは、最先端のYOLOモデルをカスタムアプリケーション向けにファインチューニングするプロセスを簡素化します。ユーザーは、事前学習済みの重みを簡単にロードして、画像分類、検出、セグメンテーションなどのタスクのために、独自のデータセットでトレーニングを開始できます。Ultralytics HUBプラットフォームは、データセットの管理、モデルのトレーニング、最終的なデプロイメントのための統合ソリューションを提供し、このワークフローをさらに効率化します。最高のパフォーマンスを得るには、ファインチューニングを慎重なハイパーパラメータ調整と組み合わせることがよくあります。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました