YOLO 비전 2025의 주요 하이라이트!

AI 및 컴퓨터 비전 커뮤니티가 9월 25일 Ultralytics연례 하이브리드 비전 AI 행사인 YOLO Vision 2025(YV25)를 위해 한자리에 모였습니다. 런던의 펠리곤에서 개최되어 전 세계로 스트리밍된 이 행사에는 다양한 연구자, 엔지니어, AI 애호가들이 모여 아이디어를 공유하고 Ultralytics YOLO26과 같은 새로운 혁신에 대해 배웠습니다.

4년 차를 맞이한 이 행사는 도달 범위와 영향력 면에서 꾸준히 성장해 왔습니다. YV25 라이브 스트림은 이미 6,800회 이상의 조회수를 기록하고 49,000회 이상의 노출을 발생시켰으며 2,000시간에 가까운 시청 시간을 모았습니다.

YV25는 호스트인 오이신 러니의 오프닝 멘트로 시작되었으며, 그는 참석자들이 서로 소통하고 공유하며 행사를 최대한 활용할 수 있도록 독려하는 것으로 행사의 분위기를 조성했습니다. 그는 "YOLO 비전 2025는 데이터, 머신러닝, 컴퓨터 비전 발전에 집중하기 위해 오픈 소스 비전 AI 커뮤니티를 하나로 묶는 컨퍼런스입니다."라고 말했습니다.

이 글에서는 제품 출시, 기조 강연, 패널, 라이브 데모, 그리고 이 날을 특별하게 만든 커뮤니티의 순간을 포함하여 YOLO 비전 2025의 주요 하이라이트를 요약해 보겠습니다. 지금 바로 시작하겠습니다!

단일 GPU 3,000만 달러 규모의 시리즈 A 펀딩으로 도약하기

행사 전부터 신제품 출시에 대한 기대감이 높았고, 저희 창립자 겸 CEO인 Glenn Jocher는 그 에너지로 하루를 시작했습니다.

그는 2020년에는 지금은 구식이 되어버린 MacBook에 연결된 단일 1080 Ti로 실험을 실행하던 시절을 회상하며 Ultralytics 여정을 공유했습니다. 이렇게 소박하게 시작한 Ultralytics YOLO 모델을 기반으로 매일 수십억 건의 추론을 수행하는 글로벌 커뮤니티로 성장했습니다.

글렌은 최근 3천만 달러 규모의 시리즈 A 투자 라운드를 마감한 Ultralytics 대해서도 이야기했습니다. 그는 이 투자를 통해 팀을 확장하고 연구를 확대하며 컴퓨터 비전의 경계를 계속 넓히는 데 필요한 컴퓨팅 리소스를 확보함으로써 다음 단계의 성장에 박차를 가할 수 있게 되었다고 설명했습니다.

Ultralytics YOLO26: 더 빠르고, 더 작고, 더 나은 YOLO 모델

글렌은 이어서 Ultralytics 두 가지 새로운 노력에 대해 발표했습니다. 첫 번째는 더 작고, 더 빠르고, 더 효율적이면서도 더 높은 정확도를 달성하도록 설계된 Ultralytics YOLO 제품군의 최신 모델인 Ultralytics YOLO26입니다. 두 번째는 데이터, 교육, 배포 및 모니터링을 결합하여 컴퓨터 비전 솔루션을 그 어느 때보다 쉽게 구축할 수 있는 새로운 엔드투엔드 SaaS 워크스페이스인 Ultralytics 플랫폼으로, 조만간 발표될 예정입니다.

그림 1. 글렌 조처가 YOLO 비전 2025 무대에서 Ultralytics YOLO26을 발표하고 있습니다.

‍

YOLO26은 실제 사용에 실용적이면서 성능을 향상시키도록 제작되었습니다. 가장 작은 버전은 이미 CPU에서 최대 43% 더 빠르게 실행되면서도 정확도를 향상시켜 모바일 장치에서 대규모 엔터프라이즈 시스템에 이르기까지 애플리케이션에 이상적입니다. YOLO26은 10월 말에 공개적으로 제공될 예정입니다.

다음은 YOLO26의 주요 기능에 대한 간략한 소개입니다.

간소화된 아키텍처: 이전에는 모델 속도를 늦췄던 DFL(Distribution Focal Loss) 모듈이 제거되었습니다. 이제 YOLO26은 정확도를 희생하지 않고도 더 효율적으로 실행됩니다.
‍
더 빠른 예측: YOLO26은 비최대 억제NMS 단계를 건너뛰는 옵션을 도입하여 결과를 더 빠르게 제공하고 실시간 배포를 용이하게 합니다.
↪f_200D↩
더욱 향상된 작은 객체 감지 능력: 새로운 학습 방법은 안정성을 개선하고 복잡한 장면에서 작은 디테일을 감지할 때 특히 정확도를 크게 향상시킵니다.
‍
더 스마트한 훈련: 새로운 MuSGD 옵티마이저는 두 가지 훈련 기술의 강점을 결합하여 모델이 더 빠르게 학습하고 더 높은 정확도에 도달하도록 돕습니다.

Ultralytics 플랫폼에 대한 첫 번째 살펴보기

YOLO26을 소개한 후, 글렌은 제품 엔지니어링 책임자인 프라텍 바트나가르를 초대해 곧 출시될 다음 프로젝트인 Ultralytics 플랫폼을 시연했습니다. 전체 컴퓨터 비전 워크플로우를 간소화하기 위해 구축된 이 플랫폼은 데이터 세트, 주석, 교육, 배포 및 모니터링을 한곳에 모으는 것을 목표로 합니다.

Prateek는 이를 자동차 튜닝에 비유했습니다. 타이어, 엔진, 변속기를 위해 여러 상점을 방문하는 대신 모든 것이 한 차고에서 이루어집니다. 마찬가지로 이 플랫폼은 개발자에게 비전 AI 모델의 전체 라이프사이클을 관리할 수 있는 통합 작업 공간을 제공합니다.

이 데모에서는 데이터 세트 준비 속도를 높이는 AI 지원 어노테이션 도구, 전문가와 초보자 모두를 위한 맞춤형 학습 옵션, 실시간 학습 실행 모니터링을 선보였습니다.

에지 배포에 대한 패널 토론의 통찰력

YV25의 또 다른 하이라이트는 Oisin Lunny가 진행한 에지 배포에 대한 패널이었습니다. 이 세션에는 Sony Semiconductor Solutions의 Yuki Tsuji, Raspberry Pi의 David Plowman 및 Glenn Jocher가 참여했습니다.

이번 토론에서는 AI를 에지로 이동하면 대기 시간이 줄어들고 비용이 절감되며 개인 정보 보호가 향상되는 방법에 대해 논의했습니다. Yuki는 칩에서 직접 추론을 실행할 수 있는 Sony의 IMX500 센서를 선보였습니다. 한편 David는 Raspberry Pi가 제조업체에서 대규모 상업용 애플리케이션으로 어떻게 확장되고 있는지에 대해 이야기했습니다.

Fig 2. Oisin Lunny, Yuki Tsuji, David Plowman 및 Glenn Jocher가 참여하는 에지 배포에 대한 패널 토론.

‍

이 패널에서는 개발자에게 가장 큰 장애물 중 하나인 다양한 기기에서 모델을 원활하게 실행하는 문제도 다뤘습니다. 바로 이 부분에서 Ultralytics Python 패키지가 중요한 역할을 합니다.

다양한 내보내기 옵션을 통해 훈련된 모델을 모바일, 임베디드 시스템 또는 엔터프라이즈 하드웨어에서 프로덕션으로 간편하게 이동할 수 있습니다. 모델 변환의 어려움을 덜어주는 Ultralytics 팀이 호환성 문제로 씨름하는 대신 솔루션 구축에 집중할 수 있도록 도와줍니다.

"저는 쓰라린 경험을 통해 모델 변환이 끔찍하다는 것을 알고 있으며, 다른 사람이 대신 해준다면 훨씬 더 쉽게 작업할 수 있습니다." David의 설명입니다. 바로 이 부분에서 Ultralytics 스토리를 개선하고 사용자에게 가치 있는 무언가를 제공하고 있습니다."

혁신 및 AI 하드웨어 가속화

AI 소프트웨어의 발전은 하드웨어와 병행하여 이루어지고 있으며, 함께 컴퓨터 비전의 새로운 혁신의 물결을 주도하고 있습니다. Ultralytics YOLO 같은 모델은 정확도를 계속 발전시키고 있지만, 실제 영향력은 실행되는 플랫폼에 따라 달라집니다.

예를 들어, 시드 스튜디오는 Ultralytics YOLO 모델이 사전 로드된 reCamera 및 XIAO 보드와 같은 모듈식 저비용 하드웨어를 통해 개발자가 프로토타입 제작에서 실제 AI 시스템으로 쉽게 이동할 수 있는 방법을 선보였습니다. 이러한 종류의 하드웨어-소프트웨어 통합은 진입 장벽을 낮추고 하드웨어 수준의 혁신이 어떻게 채택을 직접적으로 가속화하는지를 보여줍니다.

다음은 하드웨어-소프트웨어 공동 설계가 어떻게 새로운 가능성을 열어주는지 강조한 다른 YV25 기조 연설의 주요 내용입니다.

양자화는 큰 속도 향상을 가져옵니다: Intel 정량화를 통해 Ultralytics YOLO 모델을 OpenVINO 변환하여 단 30분 만에 추론 속도를 54FPS에서 606FPS로 향상시킨 방법을 보여주며 최적화의 힘을 강조했습니다.
↪f_200D↩
풀스택 툴로 엣지 AI 배포를 실용적으로: NVIDIA Jetson 디바이스, TensorRT, Triton 추론 서버, DeepStream SDK가 어떻게 함께 작동하여 엣지에서 고성능 비전 AI 배포를 간소화하는지를 강조했습니다.
↪f_200D↩
개방형 생태계는 프로토타입 제작을 가속화합니다: AMD는 GPU와 ROCm 소프트웨어 스택을 기반으로 구축된 엔드투엔드 플랫폼을 강조하여 개발자가 비용을 관리하면서 프로토타입에서 배포로 빠르게 전환할 수 있도록 지원합니다.
‍
저전력 칩으로 제약된 장치로 AI 확장: DEEPX는 DX-M1 및 DX-M2 프로세서를 도입하여 5와트 미만에서 수십 TOPS를 제공하여 소형의 전력 제한 시스템에서 고급 추론을 가능하게 합니다.

컴퓨터 비전의 최신 동향

소프트웨어와 하드웨어의 발전이 함께 이루어짐에 따라 컴퓨터 비전은 그 어느 때보다 빠르게 진화하고 있습니다. 이러한 병행 개발은 정확도와 속도를 향상시킬 뿐만 아니라 비전 AI가 실제 환경에 배포되는 방식을 형성하고 있습니다. YV25에서 참가자들은 로봇 공학, 엣지 배포 및 멀티모달 AI 분야의 전문가들로부터 다양한 관점에서 이 분야의 미래에 대한 이야기를 들을 수 있었습니다.

예를 들어, 기조연설에서 D-Robotics의 Michael Hart는 Ultralytics YOLO 모델을 소형 임베디드 AI 비전 모듈인 RDK X5 보드와 페어링하여 로봇이 고급 비전 모델을 실시간으로 실행할 수 있는 방법을 시연했습니다. 그의 라이브 데모는 로봇 공학이 실험실 실험에서 실용적인 AI 기반 시스템으로 진화하면서 얼마나 발전했는지 보여줬습니다.

Fig 3. Michael Hart는 오늘날 AI 기반 로봇이 컴퓨터 비전에 어떻게 의존하는지 강조했습니다.

‍

마찬가지로, Axelera AI의 Alexis Crowell과 Steven Hunsche는 엣지에서 Vision AI를 배포할 때의 과제와 기회를 강조했습니다. 라이브 데모를 통해 Axelera AI의 Metis AI Processing Units (AIPU)가 RISC-V와 디지털 인-메모리 컴퓨팅을 결합하여 매우 낮은 전력으로 높은 성능을 제공하는 방법을 설명했습니다. M.2 및 PCIe와 같은 친숙한 폼 팩터로 패키징된 이 플랫폼의 하드웨어-소프트웨어 공동 설계는 엣지 AI 확장을 실용적이고 효율적으로 만듭니다.

또 다른 세션에서는 Hugging Face Merve Noyan이 모델이 시각과 텍스트, 오디오 및 기타 입력을 결합하는 멀티모달 AI의 부상에 대해 설명했습니다. 문서 분석에서 구현된 에이전트에 이르는 다양한 사용 사례에 대해 이야기하며 오픈 소스 혁신이 어떻게 AI 채택을 가속화하고 있는지 강조했습니다.

기술 발전과 인간 가치의 균형

YV25는 영감을 주는 큰 그림의 강연과 함께 매우 실용적인 세션도 포함되었습니다. Lightning AI의 Jiri Borovec은 PyTorch Lightning과 GPU GPU 지원을 통해 Ultralytics YOLO 모델을 훈련하고 미세 조정하는 방법을 실습을 통해 보여줬습니다.

그는 코드 예제를 통해 오픈 소스 도구, 명확한 문서 및 유연한 프레임워크를 통해 개발자가 훈련을 확장하고, 모든 단계를 검증하고, 워크플로를 자신의 프로젝트에 맞게 조정하는 것이 얼마나 쉬운지 강조했습니다. 이는 컴퓨터 비전의 실제 발전을 위해 커뮤니티와 접근 가능한 도구가 얼마나 중요한지 상기시켜 주었습니다.

스펙트럼의 다른 측면에서 연사들은 AI의 사회에서의 더 넓은 역할에 대해 생각하도록 청중에게 촉구했습니다. 기조 연설에서 미래학자이자 인본주의자이자 The Futures Agency의 CEO인 Gerd Leonhard는 “기술은 우리가 그것을 사용할 때까지 도덕적으로 중립적이다”라고 주장하면서 진정한 질문은 AI가 할 수 있는 일이 아니라 해야 할 일이라고 강조했습니다. 그는 환원주의 및 진실성 부족과 같은 함정에 빠지지 않도록 경고하고 인류의 장기적인 이익에 진정으로 기여하는 AI를 요구했습니다.

그림 4. Gerd Leonhard가 AI 솔루션을 인간 중심으로 구축하는 것에 대한 생각을 공유하고 있습니다.

‍

이러한 책임에 대한 집중은 옥스퍼드 대학의 Carissa Véliz와의 노변담화에서도 이어졌으며, 그녀는 개인 정보 보호 및 보안을 강조했습니다. 그녀는 오픈 소스 커뮤니티가 코드를 확인하고 개선하는 데 매우 중요하며 윤리와 디자인은 분리될 수 없다고 지적했습니다. 그녀의 메시지는 분명했습니다. 개발자는 오용을 예측하고 인간의 존엄성과 사회적 복지를 우선시하는 시스템을 구축해야 합니다.

런던 YV25 네트워킹

YV25는 강연과 데모를 넘어 사람들 간의 교류를 위한 공간도 마련했습니다. 커피 브레이크와 점심시간 동안 참석자들은 서로 어울려 경험을 공유하고 접근 방식을 비교하며 새로운 협력을 모색했습니다.

Ultralytics 팀에게는 직접 만날 수 있는 좋은 기회이기도 했습니다. 전 세계에 흩어져 있는 팀원들과 함께 이런 자리를 통해 유대감을 강화하고 함께 발전을 축하할 수 있습니다.

그림 5. YOLO 비전 2025에서 영감을 주는 하루를 마무리하는 Ultralytics 팀.

‍

폐회식에서는 참가자들이 편안하게 휴식을 취하며 네트워킹을 이어갈 수 있었습니다. 비전 AI의 혁신을 되돌아보고, 재충전하며, 다음 장을 기대하는 시간이었습니다.

함께 비전 AI의 경계를 넓혀갑니다

YOLO 비전 2025는 아이디어, 혁신, 커뮤니티를 축하하는 행사였습니다. Ultralytics YOLO26의 출시가 무대를 장식한 후, 엣지 배포와 인간 중심 AI에 대한 흥미로운 강연이 이어져 비전 AI의 빠른 발전과 전 세계에 미치는 영향력이 커지고 있음을 강조했습니다.

기조 세션 외에도 이번 행사에서는 사람들이 함께 모였습니다. 연구원, 개발자, 애호가들이 경험을 공유하고 의미 있는 대화를 나누며 미래에 대한 새로운 가능성을 모색했습니다. 참가자들은 Ultralytics YOLO 모델과 컴퓨터 비전의 미래에 대해 기대감을 드러내며 행사를 성황리에 마무리했습니다.

AI를 탐색할 준비가 되셨습니까? 커뮤니티 및 GitHub 저장소에 참여하여 AI 및 컴퓨터 비전에 대해 자세히 알아보십시오. 솔루션 페이지를 방문하여 농업 분야의 컴퓨터 비전 및 로봇 공학의 AI의 더 많은 응용 분야를 탐색하십시오. 라이선스 옵션을 확인하고 오늘 컴퓨터 비전을 시작하십시오!

Ultralytics YOLO 비전 2025의 주요 하이라이트!

단일 GPU 3,000만 달러 규모의 시리즈 A 펀딩으로 도약하기

Ultralytics YOLO26: 더 빠르고, 더 작고, 더 나은 YOLO 모델

Ultralytics 플랫폼에 대한 첫 번째 살펴보기

에지 배포에 대한 패널 토론의 통찰력

혁신 및 AI 하드웨어 가속화

컴퓨터 비전의 최신 동향

기술 발전과 인간 가치의 균형

런던 YV25 네트워킹

함께 비전 AI의 경계를 넓혀갑니다

이 카테고리에서 더 읽어보기

라스베이거스 CES Ultralytics 주요 하이라이트

메이커 페어 로마 2025의 Ultralytics 주요 하이라이트

메이커 페어 심천 2025의 Ultralytics 주요 하이라이트

함께 미래의 AI를 만들어 갑시다!