あなたが経験豊富なAI開発者であれ、ビジョンAIを探求し始めたばかりであれ、Ultralytics YOLO11のようなコンピュータビジョンモデルで遊び、実験するための信頼できる環境を持つことは重要です。環境とは、AIモデルを効率的に設計、テスト、展開するために必要なツール、リソース、インフラストラクチャを指します。
複数のオンライン・プラットフォームがさまざまなAIツールを提供しているが、その多くはデータの準備からモデルのデプロイまで、AIのライフサイクル全体を統一した環境を提供していない。そこで、AI開発のためのオールインワン・プラットフォームであるLightning AIが登場し、データ準備からデプロイまでのプロセスを効率化する。
AIとコンピュータビジョンの進歩に焦点を当てたUltralytics主催の年次ハイブリッドイベント、YOLO Vision 2024(YV24)で、AI開発を容易にすることの関連性が紹介された。Lightning AIのCTOであるルカ・アンティガは、「Going YOLO on Lightning Studios」と題した基調講演を行い、Lightning AIを使用して、UltralyticsのYOLOモデルを迅速かつスムーズに、技術的な複雑さに関与することなくトレーニングする方法を説明した。
この記事では、ルカ氏の講演から得られた重要なポイントを、実際のコンピュータ・ビジョン・アプリケーションから、Lightning AIを使ったUltralytics YOLOモデルのトレーニングやデプロイに関するライブ・デモまで、あらゆる角度からご紹介します。さっそく始めましょう!
ルカは基調講演の冒頭で、さまざまな業界におけるYOLOモデルの影響力について、自身の考えと評価を語った。彼は、YOLOモデルが製造業や農業などの分野でどのように応用できるかを強調した。YOLOがビルダーのコミュニティー、つまり実際の実用的な問題を解決する必要のある人々に与えた影響を高く評価している。
AIトレーニングへの関心の高まりと結びつけて、彼はAIモデル開発をより速く、よりシンプルに、そして誰もがアクセスできるように設計されたプラットフォーム、Lightning AIを紹介した。このプラットフォームは、AIの反復的な進化をサポートし、開発者がモデルを改良・改善するのに役立つ。
また、Lightning AIは、AIモデルの学習プロセスを簡素化するフレームワークであるPyTorch Lightningと類似していると指摘した。しかし、異なる点は、Lightning AIがより包括的なプラットフォームであり、AIモデルのトレーニングだけでなく、AI開発プロセス全体に対してより広範なツールと機能を提供する点だ。
Lightning AIの重要なコンポーネントであるLightning Studiosは、AIモデルを設計、トレーニング、デプロイするための直感的なワークスペースを提供し、ワークフロー全体をシームレスかつ効率的にします。Lightning Studiosは、クラウド上で動作するAIの再現可能な開発環境と考えることができる。例えば、Jupyter Notebookのような環境を提供し、複製して別の開発者と共有できるため、コラボレーションの向上に役立つ。
ルカは、ライトニング・スタジオの利点について次のように語った。CPU(Central Processing Unit)マシンからGPU(Graphics Processing Unit)マシンに変更したり、1000台のマシンにまたがってトレーニングを開始したりする必要があっても、環境は永続的です」。
次にルカは、Lightning Studiosをいかに早く使い始めることができるかを実演した。数回クリックするだけで、新しいスタジオを開き、Jupyter NotebooksやVS Codeのようなツールや環境にアクセスできる。彼は、異なるマシン間の切り替えがいかに簡単かを紹介した。作業中のタスクがより大きなパワーを必要とする場合、CPUからより強力なGPUに簡単に切り替えることができる。GPUは使用中のみアクティブになり、それ以外はスリープモードに入るので、クレジットを節約できる。
ルカはまた、Studio Templatesを使うメリットについても言及した。コミュニティによってあらかじめ作られたAIコーディング環境であり、何も設定することなく使用できる。AIプロジェクト用の環境を構築するのは時間がかかるものですが、Studio Templatesは生産性を高めるのに役立ちます。これらの環境には、インストールされた依存関係、モデルの重み、データ、コードなど、AIプロジェクトに必要なすべてのものがあらかじめロードされています。
Luca氏は次にライブデモに移り、Lightning Studioを使用してUltralytics YOLOモデルをトレーニングする方法を紹介した。彼は、すでにすべての依存関係がインストールされているStudio Templateを開き、トレーニングプロセスをスピードアップするために4つのGPUを搭載したマシンをスピンアップした。データに関しては、データをマシンに直接保存するか、クラウドからストリーミングするかを選択でき、トレーニングプロセスをより高速かつ効率的に行えると述べた。
数秒後にはマシンの準備が整い、ルカはすぐにトレーニングセッションを開始した。デモ中、些細な問題でマシンが不意に停止したが、ライトニングスタジオはシームレスに中断したところから再開し、進捗が失われることはなかった。ルカは、予期せぬ中断に直面しても、この信頼性がスムーズなワークフローを支えていることを指摘した。
さらにデモを進めると、機械学習のメトリクスをリアルタイムで可視化するツールであるTensorBoardを使って、トレーニングの進捗を簡単にモニタリングできることを紹介した。Lightning Studioでは、同じワークスペースにいるあなたやチームメイトがTensorBoardのビューにアクセスするためのURLを自動生成することで、余計な設定をすることなく、さらにシンプルになります。これにより、コラボレーションが合理化され、全員が同じページにいることができます。
デモの後、ルカはLightning AIが最近立ち上げた新しいプロジェクト、LitServeに講演の焦点を移した。LitServeは、学習済みのモデルを他の人が利用できるスケーラブルなサービスにするプロセスを簡素化し、複雑なデプロイメント・パイプラインを不要にする。モデルのパッケージングからデプロイまで、最小限の労力で処理できるように設計されている。
これをリアルタイムで示すために、ルカは事前に訓練されたUltralyticsのYOLOv8モデルを使った簡単なデモを聴衆に披露した。彼はシンプルなAPIを作成し、リクエストを処理し、数秒で画像予測を返すことができた。つまり、誰でもこのAPIに画像をpingすれば、物体検出のようなコンピュータ・ビジョン・タスクの結果をほぼ瞬時に受け取ることができるのだ。舞台裏では、UltralyticsのYOLOv8モデルがサービスとして展開され、効率的にリクエストを処理し、画像を処理し、最小限の待ち時間で予測を提供している。
彼はピザの画像で推論を実行し、Ultralytics YOLOv8はピザ、スプーン、ダイニングテーブルなどのオブジェクトの識別に成功した。彼は、最初のリクエストは "コールドスタート "のため少し時間がかかるが、システムがウォームアップすれば、その後のリクエストはずっと速くなると説明した。
ルカは、『これを外の世界に公開したい場合はどうすればいいのか?彼は、API Builderプラグインが、あなたのモデルをライブで本番稼動可能なサービスにするのをいかに簡単にするかを概説した。カスタムドメイン、追加されたセキュリティ、シームレスな統合などの機能により、あなたのモデルを誰でも簡単にアクセスできるようにすることができます。
講演の最後にルカ氏は、AI開発におけるLightning Studioのスケーラビリティと柔軟性について触れた。彼は、このプラットフォームが複数のマシンにまたがってモデルをトレーニングできること、最大10,000ノードまで拡張できること、中断しても自動的に再開されるフォールト・トレラント・トレーニングについて言及した。
例えば、GPUクラスター上のトレーニングジョブがハードウェアの問題やサーバーのリブートによって中断された場合、Lightning Studiosはプロセスが中断されたところから正確に再開されるようにします。そのため、ImageNetやCOCOのような巨大なデータセットでディープラーニングモデルをトレーニングするような、大規模なAIプロジェクトに最適です。
ルカが語ったライトニング・スタジオのその他の主なメリットは以下の通りだ:
YV24でのルカの基調講演では、UltralyticsのYOLOモデルやLightning AIのようなツールとAIを組み合わせることで、現実世界の問題を解決する方法がどのように変化しているかが強調された。これらのツールによって、開発者は、さまざまな業界の特定の問題に取り組むように設計されたモデルを訓練し、展開することが容易になります。
同氏は、Lightning Studiosが開発プロセス全体をより迅速かつアクセスしやすくし、開発者が強力なソリューションを簡単に作成できるようにする方法を説明した。Lightning AIのような最先端プラットフォームの中核となるコンピュータビジョンモデルは、AIソリューションが課題に対処する方法を変革しています。特に、最新のUltralytics YOLO11モデルにより、開発者は有意義なインパクトを与えるソリューションを構築することができます。
私たちのコミュニティに参加して、AIとその実用的な使用に関する最新情報を入手しましょう。GitHubのリポジトリをチェックして、自動運転車のAIや ヘルスケアにおけるコンピュータビジョンなどの分野におけるイノベーションを探求しましょう。