욜로 비전 선전
선전
지금 참여하기

Ultralytics의 YOLO Vision 2025 주요 하이라이트!

Abirami Vina

5분 분량

2025년 9월 29일

Ultralytics의 가장 큰 연례 행사를 되짚어보며 Ultralytics YOLO26 출시, 영감을 주는 패널 토론, 주요 커뮤니티 하이라이트를 소개합니다.

AI 및 컴퓨터 비전 커뮤니티는 9월 25일에 Ultralytics의 연례 하이브리드 Vision AI 이벤트인 YOLO Vision 2025(YV25)를 위해 모였습니다. 런던의 The Pelligon에서 개최되어 전 세계로 스트리밍된 이 행사에서는 다양한 연구원, 엔지니어 및 AI 애호가 그룹이 모여 아이디어를 공유하고 Ultralytics YOLO26과 같은 새로운 혁신에 대해 배웠습니다.

4년 차를 맞이한 이 행사는 도달 범위와 영향력 면에서 꾸준히 성장해 왔습니다. YV25 라이브 스트림은 이미 6,800회 이상의 조회수를 기록하고 49,000회 이상의 노출을 발생시켰으며 2,000시간에 가까운 시청 시간을 모았습니다.

YV25는 호스트인 Oisin Lunny의 오프닝 노트로 시작되었으며, 참석자들이 서로 연결하고, 공유하고, 이벤트를 최대한 활용하도록 장려함으로써 그날의 분위기를 설정했습니다. 그의 말에 따르면, "YOLO Vision 2025는 데이터, 머신 러닝 및 컴퓨터 비전 발전에 집중하기 위해 오픈 소스 비전 AI 커뮤니티를 통합하는 컨퍼런스입니다."

이번 글에서는 제품 출시, 기조 연설, 패널 토론, 라이브 데모, 그리고 그 날을 특별하게 만들었던 커뮤니티 순간들을 포함하여 YOLO Vision 2025의 주요 하이라이트를 요약해 보겠습니다. 그럼 시작해 볼까요!

단일 GPU에서 3천만 달러의 시리즈 A 펀딩으로 도약

행사 전부터 신제품 출시에 대한 기대감이 높았고, 저희 창립자 겸 CEO인 Glenn Jocher는 그 에너지로 하루를 시작했습니다. 

그는 2020년에 MacBook에 연결된 단일 1080 Ti에서 실험을 실행했던 당시를 회상하며 Ultralytics의 여정을 공유했습니다. 오늘날에는 구식 설정입니다. 그 소박한 시작에서 Ultralytics는 YOLO 모델로 구동되는 수십억 건의 일일 추론을 통해 글로벌 커뮤니티로 성장했습니다.

Glenn은 또한 Ultralytics가 최근 3천만 달러의 시리즈 A 펀딩을 마감한 것에 대해서도 이야기했습니다. 그는 이 투자가 팀 규모 확장, 연구 확대, 컴퓨터 비전의 경계를 계속 확장하는 데 필요한 컴퓨팅 리소스 확보를 통해 다음 단계의 성장을 어떻게 촉진할 것인지 설명했습니다. 

Ultralytics YOLO26: 더 나은, 더 빠른, 더 작은 YOLO 모델

Glenn은 Ultralytics의 두 가지 새로운 노력을 발표했습니다. 첫 번째는 Ultralytics YOLO 제품군 중 최신 모델인 Ultralytics YOLO26으로, 훨씬 더 높은 정확도를 달성하면서 더 작고 빠르며 효율적으로 설계되었습니다. 두 번째는 데이터, 훈련, 배포 및 모니터링을 결합하여 컴퓨터 비전 솔루션 구축을 그 어느 때보다 쉽게 만드는 새로운 엔드 투 엔드 SaaS 작업 공간인 Ultralytics Platform으로, 가까운 시일 내에 발표될 예정입니다.

그림 1. Glenn Jocher가 YOLO Vision 2025 무대에서 Ultralytics YOLO26을 발표하고 있습니다.

YOLO26은 실제 사용에 실용적이면서 성능을 향상시키도록 제작되었습니다. 가장 작은 버전은 이미 CPU에서 최대 43% 더 빠르게 실행되면서도 정확도를 향상시켜 모바일 장치에서 대규모 엔터프라이즈 시스템에 이르기까지 애플리케이션에 이상적입니다. YOLO26은 10월 말에 공개적으로 제공될 예정입니다.

다음은 YOLO26의 주요 기능에 대한 간략한 소개입니다.

  • 간소화된 아키텍처: 이전에는 모델 속도를 늦췄던 DFL(Distribution Focal Loss) 모듈이 제거되었습니다. 이제 YOLO26은 정확도를 희생하지 않고도 더 효율적으로 실행됩니다.
  • 더 빠른 예측: YOLO26은 NMS(Non-Maximum Suppression, 비최대 억제) 단계를 건너뛸 수 있는 옵션을 도입하여 결과를 더 빠르게 제공하고 실시간 배포를 용이하게 합니다.
  • 더욱 향상된 작은 객체 감지 능력: 새로운 학습 방법은 안정성을 개선하고 복잡한 장면에서 작은 디테일을 감지할 때 특히 정확도를 크게 향상시킵니다.
  • 더 스마트한 훈련: 새로운 MuSGD 옵티마이저는 두 가지 훈련 기술의 강점을 결합하여 모델이 더 빠르게 학습하고 더 높은 정확도에 도달하도록 돕습니다.

Ultralytics 플랫폼 미리보기

YOLO26을 소개한 후 Glenn은 제품 엔지니어링 책임자인 Prateek Bhatnagar를 초청하여 Ultralytics 플랫폼이라는 다음 프로젝트를 시연했습니다. 전체 컴퓨터 비전 워크플로를 간소화하기 위해 구축된 이 플랫폼은 데이터 세트, 주석, 훈련, 배포 및 모니터링을 한 곳에서 통합하는 것을 목표로 합니다.

Prateek는 이를 자동차 튜닝에 비유했습니다. 타이어, 엔진, 변속기를 위해 여러 상점을 방문하는 대신 모든 것이 한 차고에서 이루어집니다. 마찬가지로 이 플랫폼은 개발자에게 비전 AI 모델의 전체 라이프사이클을 관리할 수 있는 통합 작업 공간을 제공합니다.

이 데모에서는 데이터 세트 준비 속도를 높이는 AI 지원 어노테이션 도구, 전문가와 초보자 모두를 위한 맞춤형 학습 옵션, 실시간 학습 실행 모니터링을 선보였습니다. 

에지 배포에 대한 패널 토론의 통찰력

YV25의 또 다른 하이라이트는 Oisin Lunny가 진행한 에지 배포에 대한 패널이었습니다. 이 세션에는 Sony Semiconductor Solutions의 Yuki Tsuji, Raspberry Pi의 David Plowman 및 Glenn Jocher가 참여했습니다. 

이번 토론에서는 AI를 에지로 이동하면 대기 시간이 줄어들고 비용이 절감되며 개인 정보 보호가 향상되는 방법에 대해 논의했습니다. Yuki는 칩에서 직접 추론을 실행할 수 있는 Sony의 IMX500 센서를 선보였습니다. 한편 David는 Raspberry Pi가 제조업체에서 대규모 상업용 애플리케이션으로 어떻게 확장되고 있는지에 대해 이야기했습니다.

Fig 2. Oisin Lunny, Yuki Tsuji, David Plowman 및 Glenn Jocher가 참여하는 에지 배포에 대한 패널 토론.

패널에서는 개발자에게 가장 큰 어려움 중 하나인 다양한 장치에서 모델을 원활하게 실행하는 문제도 다루었습니다. 바로 이 부분에서 Ultralytics Python 패키지가 핵심적인 역할을 합니다. 

광범위한 내보내기 옵션을 통해 훈련된 모델을 모바일, 임베디드 시스템 또는 엔터프라이즈 하드웨어에서 프로덕션으로 쉽게 이동할 수 있습니다. Ultralytics는 모델 변환의 어려움을 해소함으로써 팀이 호환성 문제와 씨름하는 대신 솔루션 구축에 집중할 수 있도록 지원합니다.

David가 설명했듯이 "모델 변환이 끔찍하다는 것을 뼈저리게 경험했기 때문에 다른 사람이 대신해 준다면 훨씬 더 편해질 것입니다. Ultralytics는 스토리를 실제로 개선하고 사용자에게 가치 있는 것을 제공하는 곳입니다."라고 말했습니다. 

혁신 및 AI 하드웨어 가속화

AI 소프트웨어 발전은 하드웨어와 병행하여 이루어지고 있으며, 이들은 함께 컴퓨터 비전 분야에서 새로운 혁신의 물결을 일으키고 있습니다. Ultralytics YOLO와 같은 모델이 지속적으로 정확도를 높이는 동시에 실제 세계에 미치는 영향은 모델이 실행되는 플랫폼에 따라 달라집니다.

예를 들어, Seeed Studio는 Ultralytics YOLO 모델이 사전 로드된 reCamera 및 XIAO 보드와 같은 모듈식 저가형 하드웨어가 개발자가 프로토타입 제작에서 실제 AI 시스템으로 쉽게 이동할 수 있도록 하는 방법을 보여주었습니다. 이러한 종류의 하드웨어-소프트웨어 통합은 진입 장벽을 낮추고 하드웨어 수준의 혁신이 어떻게 채택을 직접적으로 가속화하는지 보여줍니다.

다음은 하드웨어-소프트웨어 공동 설계가 어떻게 새로운 가능성을 열어주는지 강조한 다른 YV25 기조 연설의 주요 내용입니다.

  • 양자화는 큰 속도 향상을 가능하게 합니다: Intel은 Ultralytics YOLO 모델을 양자화를 통해 OpenVINO로 변환하여 최적화의 힘을 강조하면서 추론 속도를 단 30분 만에 54 FPS에서 606 FPS로 향상시키는 방법을 보여주었습니다.
  • 풀 스택 도구로 에지 AI 배포 실현: NVIDIA는 Jetson 장치, TensorRT, Triton Inference Server 및 DeepStream SDK가 함께 작동하여 에지에서 고성능 비전 AI 배포를 간소화하는 방법을 강조했습니다.
  • 개방형 생태계는 프로토타입 제작을 가속화합니다: AMD는 GPU와 ROCm 소프트웨어 스택을 기반으로 구축된 엔드투엔드 플랫폼을 강조하여 개발자가 비용을 관리하면서 프로토타입에서 배포로 빠르게 전환할 수 있도록 지원합니다.
  • 저전력 칩으로 제약된 장치로 AI 확장: DEEPX는 DX-M1 및 DX-M2 프로세서를 도입하여 5와트 미만에서 수십 TOPS를 제공하여 소형의 전력 제한 시스템에서 고급 추론을 가능하게 합니다.

컴퓨터 비전의 최신 동향

소프트웨어와 하드웨어의 발전이 함께 이루어짐에 따라 컴퓨터 비전은 그 어느 때보다 빠르게 진화하고 있습니다. 이러한 병행 개발은 정확도와 속도를 향상시킬 뿐만 아니라 비전 AI가 실제 환경에 배포되는 방식을 형성하고 있습니다. YV25에서 참가자들은 로봇 공학, 엣지 배포 및 멀티모달 AI 분야의 전문가들로부터 다양한 관점에서 이 분야의 미래에 대한 이야기를 들을 수 있었습니다.

예를 들어, 기조 연설에서 D-Robotics의 Michael Hart는 Ultralytics YOLO 모델과 소형 임베디드 AI 비전 모듈인 소형 RDK X5 보드를 결합하면 로봇이 고급 비전 모델을 실시간으로 실행할 수 있는 방법을 시연했습니다. 그의 라이브 데모는 로봇 공학이 실험실 실험에서 실용적인 AI 기반 시스템으로 얼마나 발전했는지 보여주었습니다.

Fig 3. Michael Hart는 오늘날 AI 기반 로봇이 컴퓨터 비전에 어떻게 의존하는지 강조했습니다.

마찬가지로, Axelera AI의 Alexis CrowellSteven Hunsche는 엣지에서 Vision AI를 배포할 때의 과제와 기회를 강조했습니다. 라이브 데모를 통해 Axelera AI의 Metis AI Processing Units (AIPU)가 RISC-V와 디지털 인-메모리 컴퓨팅을 결합하여 매우 낮은 전력으로 높은 성능을 제공하는 방법을 설명했습니다. M.2 및 PCIe와 같은 친숙한 폼 팩터로 패키징된 이 플랫폼의 하드웨어-소프트웨어 공동 설계는 엣지 AI 확장을 실용적이고 효율적으로 만듭니다.

다른 세션에서 Hugging Face의 Merve Noyan은 모델이 시각, 텍스트, 오디오 및 기타 입력을 결합하는 멀티모달 AI의 부상에 대해 탐구했습니다. 그녀는 문서 분석에서부터 구현된 에이전트에 이르기까지 다양한 사용 사례에 대해 이야기하면서 오픈 소스 혁신이 AI 도입을 가속화하는 방식을 강조했습니다.

기술 발전과 인간 가치의 균형

YV25는 영감을 주는 큰 그림에 대한 강연을 특징으로 하는 동시에 매우 실용적인 세션도 포함했습니다. Lightning AI의 Jiri Borovec은 PyTorch Lightning 및 다중 GPU 지원을 통해 Ultralytics YOLO 모델을 훈련하고 미세 조정하는 방법을 보여주는 실습 워크숍을 진행했습니다. 

그는 코드 예제를 통해 오픈 소스 도구, 명확한 문서 및 유연한 프레임워크를 통해 개발자가 훈련을 확장하고, 모든 단계를 검증하고, 워크플로를 자신의 프로젝트에 맞게 조정하는 것이 얼마나 쉬운지 강조했습니다. 이는 컴퓨터 비전의 실제 발전을 위해 커뮤니티와 접근 가능한 도구가 얼마나 중요한지 상기시켜 주었습니다.

스펙트럼의 다른 측면에서 연사들은 AI의 사회에서의 더 넓은 역할에 대해 생각하도록 청중에게 촉구했습니다. 기조 연설에서 미래학자이자 인본주의자이자 The Futures Agency의 CEO인 Gerd Leonhard는 “기술은 우리가 그것을 사용할 때까지 도덕적으로 중립적이다”라고 주장하면서 진정한 질문은 AI가 할 수 있는 일이 아니라 해야 할 일이라고 강조했습니다. 그는 환원주의 및 진실성 부족과 같은 함정에 빠지지 않도록 경고하고 인류의 장기적인 이익에 진정으로 기여하는 AI를 요구했습니다.

그림 4. Gerd Leonhard가 AI 솔루션을 인간 중심으로 구축하는 것에 대한 생각을 공유하고 있습니다.

이러한 책임에 대한 집중은 옥스퍼드 대학의 Carissa Véliz와의 노변담화에서도 이어졌으며, 그녀는 개인 정보 보호 및 보안을 강조했습니다. 그녀는 오픈 소스 커뮤니티가 코드를 확인하고 개선하는 데 매우 중요하며 윤리와 디자인은 분리될 수 없다고 지적했습니다. 그녀의 메시지는 분명했습니다. 개발자는 오용을 예측하고 인간의 존엄성과 사회적 복지를 우선시하는 시스템을 구축해야 합니다.

런던 YV25 네트워킹

YV25는 강연과 데모를 넘어 사람들 간의 교류를 위한 공간도 마련했습니다. 커피 브레이크와 점심시간 동안 참석자들은 서로 어울려 경험을 공유하고 접근 방식을 비교하며 새로운 협력을 모색했습니다.

Ultralytics 팀에게는 직접 만날 수 있는 좋은 기회이기도 했습니다. 전 세계에 흩어져 있는 팀원들에게 이러한 시간은 유대감을 강화하고 함께 발전을 기념하는 데 도움이 됩니다.

Fig 5. YOLO Vision 2025에서 영감을 주는 하루를 마무리하는 Ultralytics 팀.

폐회식에서는 참가자들이 편안하게 휴식을 취하며 네트워킹을 이어갈 수 있었습니다. 비전 AI의 혁신을 되돌아보고, 재충전하며, 다음 장을 기대하는 시간이었습니다.

함께 비전 AI의 경계를 넓혀갑니다

YOLO Vision 2025는 아이디어, 혁신 및 커뮤니티를 기념하는 자리였습니다. Ultralytics YOLO26 출시를 시작으로 엣지 배포 및 인간 중심 AI에 대한 흥미로운 강연이 이어졌으며, Vision AI의 빠른 발전과 세계에 미치는 영향력이 점점 더 커지고 있음을 강조했습니다.

기조 세션 외에도 이 행사는 사람들을 하나로 모았습니다. 연구원, 개발자 및 열성팬들이 경험을 공유하고 의미 있는 대화를 나누며 미래에 대한 새로운 가능성을 탐색했습니다. 이 행사는 참가자들이 Ultralytics YOLO 모델과 컴퓨터 비전의 미래에 대해 흥분하면서 성공적으로 마무리되었습니다.

AI를 탐색할 준비가 되셨습니까? 커뮤니티GitHub 저장소에 참여하여 AI 및 컴퓨터 비전에 대해 자세히 알아보십시오. 솔루션 페이지를 방문하여 농업 분야의 컴퓨터 비전로봇 공학의 AI의 더 많은 응용 분야를 탐색하십시오. 라이선스 옵션을 확인하고 오늘 컴퓨터 비전을 시작하십시오!

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기