分類モデル、ClearML統合、GPUベンチマーク、トレーニングの再現性などを備えた新しいYOLOv5 v6.2リリースをご覧ください。

分類モデル、ClearML統合、GPUベンチマーク、トレーニングの再現性などを備えた新しいYOLOv5 v6.2リリースをご覧ください。
YOLOv5は、オブジェクト検出の最先端技術を新たな高みへと押し上げています。新しい分類モデル、トレーニングの再現性、Apple Metal Performance Shader(MPS)のサポートから、ClearMLおよびDeciとの統合まで、新しいYOLOv5 v6.2リリースをご紹介します。
2022年2月の最新リリース以来、お気に入りのYOLO Vision AIアーキテクチャの改善に取り組んでいます。以下は、最新のYOLOv5 v6.2における最も重要なアップデートです。
今回のリリースにおける主な目標は、既存の物体検出モデルと同様に、シンプルなYOLOv5の分類ワークフローを導入することです。新しいv6.2 YOLOv5-clsモデルはまだ始まりにすぎず、既存の検出モデルとともに、今後も改善を続けていきます。この取り組みへのご貢献をお待ちしております。
今回のリリースでは、2022年2月の前回のリリース以降、41人の貢献者から401件のPRが組み込まれています。分類のトレーニング、検証、予測、エクスポート(全11形式に対応)が追加され、ImageNetで事前トレーニングされたYOLOv5m-cls、ResNet(18、34、50、101)、EfficientNet(b0-b3)モデルも提供されます。
4xA100インスタンスを使用して、ImageNetでYOLOv5-cls分類モデルを90エポック学習させ、ResNetおよびEfficientNetモデルも同様のデフォルト学習設定で学習させて比較しました。すべてのモデルをCPU速度テスト用にONNX FP32に、GPU速度テスト用にTensorRT FP16にエクスポートしました。再現性を容易にするために、すべての速度テストをGoogle Colab Proで実行しました。
次期リリースv6.3は2022年9月を予定しており、YOLOv5に公式のインスタンスセグメンテーションのサポートが追加されます。また、今年後半には、分類、検出、セグメンテーションの3つのタスクすべてでアーキテクチャを更新するメジャーリリースv7.0が予定されています。
YOLOv5オープンソースGitHubリポジトリにアクセスして、最新情報を入手し、このリリースの詳細をご確認ください。