ウルトラリティクスのYOLOビジョン2024の主なハイライト!

アビラミ・ヴィナ

4 min read

2024年10月8日

Ultralyticsの年次イベントのハイライトとYOLO Visionのハイブリッド体験をお楽しみください。UltralyticsのYOLO11発表、魅力的なパネルなどをご紹介します。

9月27日、Ultralyticsは毎年恒例のハイブリッド・イベント「YOLO Vision 2024 (YV24)」にAIとコンピュータ・ビジョンのコミュニティを集めました。マドリッドのGoogle for Startups Campusで開催され、世界中に配信されたこのイベントには、専門家、開発者、愛好家が集まり、Ultralyticsの新モデルYOLO11など、ビジョンAIの最新の進歩について議論しました。このイベントのライブストリームは、すでに5,400回以上再生され、10,600回以上のインプレッションと469.5時間以上の視聴時間を記録し、世界中のイノベーターを魅了しました。

YV24は、主催者であるオイシン・ルニー氏の温かい歓迎で始まりました。彼は、コミュニティとつながりの重要性を強調し、「私は、素晴らしいアイデアと素晴らしいコミュニティの力を信じています。

この記事では、魅力的なパネルディスカッションから コンピュータビジョンの魅力的な実世界での使用例まで、YOLO Vision 2024の主なハイライトをピンポイントでご紹介します。また、エッジAIからハードウェアアクセラレーションまでの技術的な講演や、イベントを成功に導いたネットワーキングやコミュニティ形成の瞬間についてもご紹介します。AIのイノベーション、重要な発表、ビジョンAIの将来など、このYOLO Vision 2024のイベントレポは、重要なポイントをすべて網羅しています! 

YOLOビジョンでUltralytics YOLO11が発表される

YOLOビジョン2024の前に予告されていた製品発表が、Ultralyticsの創設者兼CEOのグレン・ジョーチャーによる最初の基調講演での発表でついに明らかになった。グレンは、数ヶ月前から開発が進められていた次世代のコンピューター・ビジョン・モデルを示すUltralytics YOLO11を紹介した。この発表の興奮をさらに盛り上げるために、グレンは後にThe Ravit Showのインタビューに応じ、YOLO11の開発についての洞察を語った。

基調講演の中でグレンは、素粒子物理学のバックグラウンドから始まり、宇宙を理解することに魅了され、最終的に機械学習とコンピューター・ビジョンに至った経緯など、会社の歩みを語った。

__wf_reserved_inherit
図1.ウルトラリティクスYOLO11は、YOLOビジョン2024のステージでグレン・ジョーチャーによって正式に発表された。

彼は、物理学の研究者が粒子の相互作用を分析する初期の仕事が、コンピューター・ビジョンにおける物体検出に似ていると説明した。彼の好奇心と最先端技術に取り組む意欲は、最終的にUltralytics YOLOv5の誕生につながった。グレンは講演を通して、オープンソースコミュニティにおけるコラボレーションと貢献の重要性を強調し、フィードバックを提供し、YOLOv5とUltralytics YOLOv8の改良に貢献してくれた世界中の開発者に感謝の意を表した。

そして、Ultralytics YOLO11の主な特徴を紹介し、以前のモデルよりも高速で、より正確で、より効率的であることを説明した。実際、YOLO11mはYOLOv8mよりも22%少ないパラメータで、COCOデータセットの精度を向上させており、スピードと精度が重要なリアルタイム・アプリケーションに最適です。

グレンは、「私たちは全部で30モデルを発表し、そのうち25モデルはオープンソースで、5つの異なるタスクに対して5つの異なるサイズで発表します」と発表の規模を強調した。タスクは、画像分類物体検出インスタンス分割ポーズ推定オリエンテッドバウンディングボックスだ。"企業向けには、100万枚の画像からなる独自のデータセットで訓練されたロバストモデルが来月から利用可能になると発表した。言うまでもなく、この発表はイベントの幕開けを盛り上げ、参加者は製造業や 自動運転車などの分野を革新するYOLO11の可能性についてもっと知りたいと思った。

YOLO Visionでのパネルディスカッション:AIカンファレンス

YOLOビジョン2024では、オイシン・ルニーがモデレーターを務めるパネルディスカッションが行われ、AI、コンピュータービジョン、コミュニティ形成に関するさまざまな見識が示された。 

最初のパネルでは、Glenn Jocher氏、Jing Qiu氏(Ultralytics社におけるYOLOモデル開発の中心人物)、そしてYOLOv10の共著者である清華大学のAo Wang氏が登壇し、生成AIと コンピュータ・ビジョンの 最近の発展について 、それぞれの類似点、相違点、そしてそれぞれの分野が他の分野に与えた影響に焦点を当てて議論した。最近の大規模言語モデル(LLM)の台頭にもかかわらず、パネルディスカッションでは、伝統的なコンピュータ・ビジョンが、ヘルスケアなどの産業における特定のタスクには依然として不可欠であることが指摘された。 

次のパネルでは、AIリーダーシップにおいて女性が直面する課題に取り組み、スピーカーが登壇した:Ultralyticsの成長担当ディレクターであるポーラ・デレンガー氏、SaaSの元CPO兼COOであるブルーナ・デ・ギマランエス氏、Latinas in TechMadridの支部長であるマリアナ・エルナンデス氏Dare to Dataの創設者であるクリスティーナ・スタソポウラス氏がそれぞれの経験を語り、メンターシップの重要性や、女性がリーダーシップを発揮するために積極的に行動する必要性について議論した。ヘルナンデス氏は、「物事が起こるのを待つのではなく、積極的に行動しましょう」とアドバイスし、聴衆の女性たちに自分を主張し、積極的にチャンスを追い求めるよう促した。パネルディスカッションでは、より協力的な職場環境を作ることの価値についても話し合われた。

__wf_reserved_inherit
図2.技術分野の女性に関するパネル:Christina Stathopoulous、Paula Derrenger、Mariana Hernandez、Oisin Lunny、Bruna de Guimarãesは遠隔参加。

最後のパネルディスカッションでは、強力なコミュニティを構築することで、AIにおけるイノベーションをどのように促進できるかを探った。Burhan Qaddoumi氏Harpreet Sahota氏、Bart Farrell氏は、オンラインと対面イベントの両方で、技術的な聴衆と関わる方法について議論した。ファレル氏の「彼らがいる場所で会わなければならない」という洞察は、コラボレーションと共有学習を促進するために、コミュニティ・メンバーと彼らの条件でつながることの重要性を共感させるものだった。

__wf_reserved_inherit
図3.左からハープリート・サホタ、バーハン・カドゥーミ、バート・ファレル、オイシン・ルニー。

YOLOビジョンにおけるAIイノベーションの実例

YV24のいくつかの講演では、YOLOモデルが様々な業界で現実の課題を解決するためにどのように応用されているかが明らかにされた。ポッドキャスト「AI Master Group」のホストを務めるジム・グリフィンはYOLOv8モデルを使ってカリフォルニアの海岸線沿いでサメの動きを ドローン監視するプロジェクトについて語った。このシステムは、ライフガード、サーフショップのオーナー、保護者に警告を発し、海から200フィート上空からサメを検知することで、海水浴客の安全を確保している。グリフィンは、真の課題はAIモデルそのものではなく、モデルの訓練に必要な大規模なドローン飛行とデータ収集であると説明した。

__wf_reserved_inherit
図4.ジム・グリフィンは、YOLOv8がドローンを使ってカリフォルニアの海岸線でサメの動きを監視している様子を紹介した。

同様に、The Main Branchの デビッド・スコット氏は、コンピュータ・ビジョンの単純な物体検出から行動分析への拡大について議論した。彼の講演では、牛の行動を追跡したり、小売店での不審な行動を特定するような実際の応用例が紹介された。スコット氏は、YOLOv8を、飲食や歩行などの特定の行動を分析することで、牛の健康状態を監視するためにどのように使用できるかを紹介した。

さらに、特に心に響いた基調講演は、NASCO Feeding Mindsの ウスマン・ウマール氏によるもので、同氏はガーナでIT教育を提供することによって、自身の組織がどのように生活を変えているかを語った。彼の財団は17のICTセンターを設立し、65,000人以上の学生を訓練しており、不法移民などの問題に対処するために地元の技術職を創出することを目標としている。ウマル氏の力強い話は、教育とテクノロジーがいかにして恵まれない地域社会に永続的な変化をもたらすことができるかを伝えた。

テック・トークYOLO Vision スピーカー・ハイライト

YV24では、AIとハードウェアがどのように融合し、新たなアイデアを生み出すかに焦点を当てたさまざまな講演も行われた。インテルソニーエヌビディアといった企業の専門家が、エッジデバイスへのYOLOモデルの導入とパフォーマンスの最適化について講演した。Intelの Dmitriy Pastushenkov氏とAdrian Boguszewski氏は、自社のハードウェアがNPU、CPU、GPUにわたってどのようにYOLOモデルをサポートしているかについて概説し、ソニーのAmir Servi氏とWei Tang氏は、エッジAIを効率的に展開するためにYOLOがAITRIOSプラットフォームとどのように統合されているかを紹介した。NVIDIAのGuy Dahan氏は、YOLOモデルの推論を向上させるためのGPUアーキテクチャの活用について語った。 

__wf_reserved_inherit
図5.NVIDIAのGPUアーキテクチャを使ったYOLOモデル推論の最適化について話すガイ・ダハン氏。

また、クアルコムHugging FaceLightning AIなどの企業も、開発者がYOLOモデルを簡単に統合・展開できるプラットフォームについて紹介した。クアルコムのDevang Aggarwal氏は、Qualcomm AI Hubを通じてYOLOv8のようなモデルをSnapdragonデバイスに最適化する方法を紹介しました。

同様に、Hugging FaceのPavel Lakubovskii氏は、彼らのオープンソースツールがどのようにYOLOv8のようなモデルを様々なワークフローにシームレスに統合することができるかを説明し、Lightning AIのLuca Antiga氏は、開発者がどのようにYOLOv8のようなモデルをコードレベルで簡単に組み込むことができるかを説明し、より迅速なプロトタイピングと反復を可能にした。

マドリードでの1週間:YOLO Visionネットワーキング・セッション

YV24までの1週間、Ultralyticsチームはマドリードに集まり、ワークショップ、共同ミーティング、オフサイト活動などを行いました。これらのアクティビティは仕事を超え、より強い人間関係を育み、イベントを前にポジティブな雰囲気を作り出しました。お祝いのアフターパーティーで締めくくられた参加者と講演者は、ネットワークを広げ、重要な収穫を共有し、将来のコラボレーションを模索する機会を得ました。チームワークと仲間意識の融合により、YV24はプロフェッショナルな成功を収め、総合的に思い出深い体験となった。

__wf_reserved_inherit
図6.YOLO Vision 2024での素晴らしい一日を祝うUltralyticsチーム。

YOLO Vision AIイノベーションとその先にあるもの

YV24は、イノベーション、コラボレーション、そしてコンピュータビジョンの未来を一堂に集めました。YOLO11の発表、魅力的なパネルディスカッション、AIハードウェアとエッジソリューションに関するディスカッションなど、このイベントは、ビジョンAIがどのように変化をもたらすことができるか、AIの進歩に追いつくために技術がどのように変化しているかに焦点を当てました。また、コミュニティ内のつながりも強化された。専門家と愛好家がアイデアを共有し、コンピューター・ビジョンとYOLOの可能性を探求した。イベントは楽しいクイズセッションで締めくくられ、Ultralyticsのパーカーがプレゼントされました。

私たちのGitHubリポジトリを訪問し、AIについてもっと学ぶために私たちの繁栄コミュニティと接続します。Vision AIがヘルスケアや 農業などの分野でどのようにイノベーションを再定義しているかをご覧ください。🚀

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク