ヨロビジョン深圳
深セン
今すぐ参加

CVPR 2025におけるUltralyticsの主なハイライト

Abirami Vina

3分で読めます

2025年6月18日

ブースのハイライトから、実際のコンピュータビジョンのユースケース、そしてナッシュビルでの思い出に残る瞬間まで、CVPR 2025でのUltralyticsの経験を振り返りますので、ぜひご参加ください。

先週、6月11日から15日まで、Ultralyticsチームは、テネシー州ナッシュビルで開催されたCVPR 2025(IEEE/CVFコンピュータビジョンおよびパターン認識会議)に参加しました。これは、コンピュータビジョンとAIの研究分野における主要な年次イベントの1つです。 

ミュージックシティセンターで開催された今年の会議には、世界中から12,000人以上の参加者が集まりました。大学の研究者やエンジニアから、業界のリーダーや開発者まで、Vision AIの限界を押し広げる人々で会場は埋め尽くされました。 

特に、CVPR 2025では、コンピュータビジョンにおける深層学習やマルチモーダル学習から、生成AIモデル、基盤モデル、自律走行や3Dシーン理解などの現実世界のアプリケーションまで、最先端の研究と会話が取り上げられました。

図1. CVPR 2025、テネシー州ナッシュビルにて。

Ultralyticsにとって、CVPR 2025での1週間は、コンピュータビジョンコミュニティとの交流、デモの共有、そして当社のUltralytics YOLOモデルが業界全体でどのように使用されているかを学ぶことに焦点が当てられました。ブース1512では、当社の最新のVision AIソリューションを紹介し、数百人の訪問者と実践的なユースケースについて話し合い、当社の取り組みがロボット工学、小売、研究など、さまざまな分野のイノベーションをどのように推進しているかを直接確認しました。 

それでは、イベントのお気に入りの瞬間をいくつか見ていきましょう。重要なポイント、会話、コミュニティのつながりに焦点を当てます。 

CVPR Nashville 2025 の展望

CVPRは1983年に初めて開催され、1985年にIEEEの公式な支援を受けました。長年にわたり、コンピュータビジョンとパターン認識の分野で最も影響力のある会議の一つに成長し、世界中の研究者、エンジニア、イノベーターが集まります。2012年以降は、コンピュータビジョン研究へのオープンアクセスを支援する非営利団体であるComputer Vision Foundation(CVF)が共同スポンサーとなり、イベントの組織において重要な役割を果たしています。 

毎年開催されるCVPRは、その技術的な深さと、初期の物体認識のブレークスルーから今日のVision AIと深層学習の進歩まで、分野全体の方向性を形成するのに役立っていることで知られています。今年の開催では、13,000件以上の論文が投稿され、昨年から13%増加しました。採択率はわずか22%であり、この会議はインパクトの大きい研究に焦点を当てるという伝統を継続しました。

CVPR 2025で注目された主要な研究テーマを簡単にご紹介します。

  • 3Dシーン理解とニューラルレンダリング: 研究者は、ロボティクス、拡張現実、シミュレーションのアプリケーションを高度化するために、複数の視点またはセンサー入力を使用して、世界を3次元で再構築および表現する方法を模索しています。
  • 生成AIを使用した画像およびビデオの合成:この分野は、テキストプロンプトやスケッチなどの最小限の入力から高品質のビジュアルを作成し、クリエイティブメディアおよびインタラクティブシステム向けの次世代ツールを強化することに重点を置いています。
  • マルチモーダル学習とビジョン-言語モデル: これらのモデルは、視覚データと言語データを組み合わせて、理解、推論、コミュニケーションを改善し、より一般的で適応性のあるAIシステムへの道を開きます。

CVPRのためにミュージックシティセンターに設置

会議が正式に始まる前に、私たちのチームはCVPR 2025に向けてすべてを準備するためにナッシュビルに到着しました。 

私たちはMusic City Centerで一日かけて準備を行い、ブース1512は3日間、デモ、会話、そしてコミュニティ構築のための私たちの拠点となりました。機材を運び込み、ハードウェアを設置し、ライブYOLOデモを設定し、ペースの速い展示会環境で全てがスムーズに動作するように慎重に配置しました。 

スペースは徐々に、機材を降ろしたり、デモをテストしたり、ブースを組み立てたりする人々で埋め尽くされました。すべてがまとまっていくのを見て、CVPRが真にグローバルで協調的なものであることを改めて実感しました。

生産的な午後を過ごした後、チームはギアを切り替え、ナッシュビルのダウンタウンを探索に出かけました。当然のことながら、彼らはブロードウェイに立ち寄り、そこではすべてのバーやレストランからライブのカントリー音楽があふれていました。 

チームの何人かはカウボーイブーツを手に入れ(私たちの中には初めての人もいました)、夜は地元の定番である Hattie B's のホットチキンで締めくくりました。仕事と楽しみが完璧に混ざり合っていました。ブースの準備は完了し、チームは CVPR 2025 が何をもたらすかを見るために充電されました。

コンピュータビジョンとAI研究に関する会話

エキスポの初日は、Ultralyticsチームが現地入りし、準備万端で始まりました。デジタルコンテンツマネージャーのNuvola Ladi、イベントマネージャーのZinnia Pourdad、機械学習エンジニアのFrancesco Mattioliが、午前9時までにミュージックシティセンターに到着しました。最終的なセットアップチェックとデモの準備が完了し、ドアが開くと同時に参加者を迎えられる状態になりました。

午前10時までに人が押し寄せ始め、展示フロアの活気がすぐに高まりました。私たちのブースはすぐに訪問者でいっぱいになり、Ultralyticsのグッズ、特にトートバッグとステッカーは数分でなくなりました。会話を始め、人々を引き込むのに役立つ、楽しいきっかけとなりました。

図2。ブース1512でのNuvola LadiZinnia PourdadFrancesco Mattioli

一日を通して、私たちは幅広いプロジェクトに取り組んでいる研究者、エンジニア、開発者と話す機会がありました。私たちのライブYOLOデモには多くの関心が集まり、ロボット工学、ヘルスケア、製造、小売など、さまざまな分野でのユースケースについて聞くことができました。初期の学術研究から展開されたエンタープライズシステムまで、私たちのモデルがどれほど広く使用されているかを知ることができ、非常に刺激を受けました。

また、Intel OpenVINOやSony Semiconductor Solutionsのチームなど、AI分野の協力者との再会も果たしました。他のイノベーターとフロアを共有することで、Vision AI分野がいかに協力的で、急速に進化し続けているかを再認識できました。

一日の終わりに、チームはプリンターズアレイに向かい、ライブカントリーミュージックを楽しみ、リラックスしました。会話とフロアでの素晴らしいエネルギーでいっぱいの一日を終え、CVPR 2025での初日を締めくくるのに最適な方法でした。

図3. チームはプリンターズ・アレイを探索する機会を得ました。

ナッシュビルのコンピュータビジョン会議での2日目

CVPR 2025の2日目は、初日の勢いをそのままに始まりました。ブース1512は一日中活気に満ちており、リピーターや新しい参加者が立ち寄り、Ultralytics YOLOモデルについて詳しく学び、自身の研究成果を共有していました。

例えば、その日の最も記憶に残る瞬間の一つは、Intel Robodogが訪れた時でした。高度なハードウェアが実用的なビジョンモデルと組み合わさって動作しているのを見ることは、イベントの精神を本当に捉えていました。

図4. IntelのRobodogがブース1512のチームを訪問。

夕方には、私たちのチームはインテルが主催するAfter.CVPR()デベロッパーミートアップに参加しました。そこは、AIエコシステム全体のエンジニア、研究者、開発者で満たされた、リラックスした協力的な空間でした。 

ミートアップでは、ライブデモや有意義な会話が夜遅くまで繰り広げられました。イベント中、Francesco MattioliはUltralyticsとOpenVINOをフィーチャーした共同デモを発表し、当社のモデルを効率的な推論パイプラインに統合する方法を紹介しました。 

彼は、Ultralytics YOLO11のようなモデルをOpenVINO形式にエクスポートして、Intelハードウェア上でより高速かつ最適化された推論を実現する方法を説明しました。このデモでは、中央処理装置(CPU)、グラフィックス処理装置(GPU)、およびニューラル処理装置(NPU)のサポートが強調されました。エッジAIおよびリアルタイムアプリケーションに取り組むチームから大きな関心が寄せられました。

図5. After.CVPR() デベロッパーミートアップの様子。

CVPRでのコンピュータビジョンアプリケーションにおける深層学習

CVPR 2025の最終日でも、ミュージックシティセンターは活気に満ちていました。参加者はまだブースを見て回り、思慮深い会話を交わし、会議での時間を最大限に活用していました。

その日のハイライトの1つは、ポスターセッションのチェックでした。これは、CVPRで研究が共有される方法の重要な部分です。従来のステージ発表とは異なり、ポスターセッションはより非公式でインタラクティブです。 

各研究者は、自分の研究を要約した大きな印刷ポスターを設置し、近くに立って説明したり、質問に答えたり、立ち寄った人と調査結果について話し合ったりします。短時間で幅広いトピックについて学ぶのに最適な方法であり、参加者と発表者の間で実際の会話を行うためのスペースが生まれます。

Vision-Languageモデルや3Dシーン理解から、ロボット工学やヘルスケアにおけるAIの現実世界の応用まで、あらゆるものを網羅した多種多様なポスターを見ることができました。これらのセッションでは、この分野全体で探求されている最新のアイデアをより詳しく見ることができ、その背後にいる人々と直接つながる機会を得ることができました。

イベントが終わりに近づき、私たちはこれまで以上に意欲を感じて会場を後にしました。この1週間は、Vision AIにおける学習、コラボレーション、そして現実的な勢いに満ちており、これらの洞察を次のステップに活かしていくことを楽しみにしています。

主なポイント

CVPR 2025は、学習、共有、つながりの素晴らしい1週間でした。最先端の研究からハンズオンデモ、素晴らしい会話まで、この会議はVision AIがどれほど急速に進歩しているか、そしてその背後にあるコミュニティがどれほど影響力があり、協力的であるかを示しました。

非常に多くの現実世界および研究アプリケーションで、Ultralytics YOLOモデルが実際に使用されているのを見て、刺激を受けました。何よりも、CVPR 2025は、コンピュータビジョンがAIイノベーションの中心にあり、今後さらに多くのことが起こることを明らかにしました。

当社のコミュニティに参加して、GitHubリポジトリでVision AIを深く掘り下げましょう。ソリューションページでは、小売業におけるAI製造業におけるコンピュータビジョンなどのイノベーションについて学ぶことができます。当社のライセンスプランをご確認いただき、今日からAIの旅を始めましょう!

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる