YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
イベント

Hugging Faceのtransformersでオープンソースのコンピュータビジョンを強化

Hugging Faceでオープンソースのコンピュータビジョンに飛び込みましょう!転移学習やTransformerについて学び、8,000以上のモデルを探索してください。Merve Noyanと一緒に知見と実用的なデモを学び、開発者がAI探求において革新を起こせるようにしましょう。

NUNuvola Ladi5 min read
Hugging Face Transformersによるオープンソースのコンピュータビジョン

As we keep exploring highlights from the YOLO VISION 2023 (YV23) event, let’s meet Merve Noyan, Developer Advocacy Engineer at Hugging Face, the leading NLP platform with pre-trained models for efficient development of language applications. In her talk, Merve shared some incredible insights into the world of open-source computer vision.

転移学習、Transformer、そしてオープンソースのコンピュータビジョンのエコシステムを巡る魅力的な旅に、ぜひお付き合いください。

転移学習の解説:クイックリキャップ

Merve氏は、あるニューラルネットワークから別のニューラルネットワークへ知識を転送することを可能にする魔法の杖、転移学習の簡単な入門から話を始めました。初期レイヤーにおけるエッジやコーナーのような普遍的な特徴でモデルを学習させ、その後特定のタスクに合わせてファインチューニングを行うことを想像してみてください。これこそが転移学習の本質であり、データ依存性を低減し精度を向上させます。

Merve氏は、ResNetやInceptionといった古典的な畳み込みバックボーンを紹介し、これからの変革的な旅の舞台を整えました。

Transformerの登場:解き明かされる謎

Transformerの何が特別なのでしょうか?Merve氏はこれを謎になぞらえ、従来の畳み込みベースのモデルと何が違うのかを解説しました。その秘密は、ラベル付けされたデータを必要とせずに特徴を捉える、自己教師あり学習を行う能力にあります。彼女が紹介したTransformerベースのモデルには、Vision Transformer、Data Efficient Transformer、CLIP、そしてSwin Transformerなどが含まれていました。

オブジェクト検出用に設計されたtransformer modelをサポートするUltralyticsと共通の基盤を築きます。このモデルは、効果的なハイブリッドエンコーダ、IOU対応のクエリ選択、そして調整可能な推論速度を特徴としています。注目すべきは、他のUltralytics YOLOv8モデルと馴染みのあるパターンに従っており、予測、学習、検証、エクスポートのオプションを提供している点です。

ワンストップショップ

次にMerve氏は、Hugging Faceが提供する宝の山について掘り下げました。8,000以上の古典的なコンピュータビジョンタスク用モデルと、10,000以上のマルチモーダルアプリケーション用モデルが揃っています。Hugging Face Hubは3,000以上のデータセットを誇り、開発者や愛好家にとっての遊び場となっています。Merve氏は、Hugging Faceの一貫したAPIのおかげで、さまざまなユースケースに対応するすぐに使えるモデルを提供し、シームレスな体験ができることを強調しました。

Hugging Faceを使った実践的なマジック

講演は実演へと移り、モデルをどれほど簡単に扱えるかが示されました。モデルやプロセッサのインスタンス化からTrainer APIを使用したファインチューニングまで、Hugging Face Transformersライブラリが開発者の強力な味方であることが明確に示されました。彼女はさらに、個人的なお気に入りであるPipeline APIを紹介し、ユーザーのワークフローを簡素化する方法を説明しました。

YOLO VISION 2023(マドリード)で登壇するMerve Noyan

図1:マドリードのGoogle for Startups Campusで開催されたYV23で登壇するMerve Noyan。

アプリケーションの展望

Merve氏は、視覚的質問応答のためのPlotモデル、画像キャプション生成のためのBlip、そして強力な画像セグメンテーションのためのSegment Anythingモデルなど、素晴らしいアプリケーションの紹介で講演を締めくくりました。Hugging FaceのエコシステムにおけるPipeline APIが注目され、技術的な詳細に深入りすることなくモデルを簡単に使用できることが強調されました。

締めくくりとして、Merve氏はElysian Diffusionを使って錯視画像を作成する実演を行い、AIの世界に楽しいひねりを加える魅力的な体験を披露してくれました。

要約すると!

結論として、Merve氏の講演は私たちにインスピレーションを与え、オープンソースのコンピュータビジョンの無限の可能性を探求したいという気持ちにさせました。Hugging FaceはAIを真に身近で、楽しく、エキサイティングなものにし、開発者が創造性を解き放てるようにしました。オープンソースコミュニティの未来と、それがもたらす素晴らしいイノベーションに乾杯!

講演の全編はこちらから視聴できます!

Explore solutions

Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜トラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

自動車産業にUltralytics YOLOモデルを用いたコンピュータビジョンを適用します。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路環境を実現します。

詳細はこちら
Real-time AI that works with your team

小売におけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるVision AIは、医療画像の迅速化、診断のスマート化、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

小売におけるAI

Ultralytics YOLOモデルで小売を再構築しましょう。Vision AIは、在庫追跡、棚モニタリング、行列管理、よりスマートな顧客インサイトを推進します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートな機械を実現します。ロボティクスにおけるVision AIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化します。Vision AIは、品質管理、欠陥検出、PPE(個人用保護具)のコンプライアンス、組立ラインの自動化を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、パッケージ検査、仕分け、車両追跡、リアルタイムの倉庫安全監視が可能になります。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜トラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

自動車産業にUltralytics YOLOモデルを用いたコンピュータビジョンを適用します。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路環境を実現します。

詳細はこちら
Real-time AI that works with your team

小売におけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるVision AIは、医療画像の迅速化、診断のスマート化、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

小売におけるAI

Ultralytics YOLOモデルで小売を再構築しましょう。Vision AIは、在庫追跡、棚モニタリング、行列管理、よりスマートな顧客インサイトを推進します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートな機械を実現します。ロボティクスにおけるVision AIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化します。Vision AIは、品質管理、欠陥検出、PPE(個人用保護具)のコンプライアンス、組立ラインの自動化を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、パッケージ検査、仕分け、車両追跡、リアルタイムの倉庫安全監視が可能になります。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜トラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

自動車産業にUltralytics YOLOモデルを用いたコンピュータビジョンを適用します。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路環境を実現します。

詳細はこちら
Real-time AI that works with your team

小売におけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるVision AIは、医療画像の迅速化、診断のスマート化、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

小売におけるAI

Ultralytics YOLOモデルで小売を再構築しましょう。Vision AIは、在庫追跡、棚モニタリング、行列管理、よりスマートな顧客インサイトを推進します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートな機械を実現します。ロボティクスにおけるVision AIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化します。Vision AIは、品質管理、欠陥検出、PPE(個人用保護具)のコンプライアンス、組立ラインの自動化を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、パッケージ検査、仕分け、車両追跡、リアルタイムの倉庫安全監視が可能になります。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう