Scaleout, Ultralytics YOLO를 활용해 모델 업데이트 시간을 수주에서 수 시간으로 단축
Scaleout이 Ultralytics YOLO와 연합 학습(federated learning)을 사용하여 민감한 데이터를 안전하게 보호하면서 엣지 디바이스에서 AI 모델을 파인튜닝하는 방법을 알아보십시오.

Problem
Scaleout은 국방, 산업 및 기타 규제 분야를 위한 엣지 AI 시스템을 개발하고 있으며, 민감한 데이터를 이동시키거나 안정적인 네트워크에 의존하지 않고도 현장에서 컴퓨터 비전 모델을 지속적으로 개선할 방법을 모색하고 있었습니다.
Solution
Scaleout은 엣지 디바이스에서 Ultralytics YOLO 모델을 파인튜닝함으로써 데이터를 현장에 유지하고 오프라인에서도 작동하며, 새로운 탐지 모델을 수주가 아닌 수 시간 내에 배포합니다.
머신러닝 모델을 학습시킬 때는 일반적으로 모든 데이터를 한곳에 모으고, 클라우드로 전송하여 완성된 모델을 배포할 수 있다고 가정합니다. 하지만 실제 환경에서는 이러한 가정이 성립하지 않는 경우가 많습니다. 국방, 산업 및 규제 환경 전반에서 데이터는 개인정보 보호법, 보안 등급 또는 막대한 대역폭 비용으로 인해 해당 위치에 묶여 있으며, 해당 위치를 연결하는 네트워크를 항상 신뢰할 수는 없습니다.
Scaleout은 바로 이러한 환경을 위한 인프라를 구축합니다. 이들의 플랫폼인 Scaleout Edge는 데이터를 모델로 이동시키는 대신 모델 학습을 데이터가 있는 곳으로 가져오는 연합 학습을 사용합니다. 컴퓨터 비전 프로젝트를 위해 Scaleout은 각 현장에 배치된 GPU 가속 엣지 스테이션인 Vision Ground Node에서 Ultralytics YOLO 모델을 커스텀 학습 및 파인튜닝함으로써 민감한 이미지가 디바이스 외부로 유출되지 않으면서도 현장에서 탐지 성능을 지속적으로 개선합니다.
Link to this section데이터가 존재하는 곳으로 머신러닝을 가져오다#
대규모 분산 시스템을 연구하던 웁살라 대학교의 연구원들에 의해 2018년에 설립된 Scaleout은 데이터를 중앙화할 수 없는 곳에서도 머신러닝이 가능하도록 만들겠다는 목표를 세웠습니다. 이들은 데이터를 한곳에 모으기가 어렵거나 불가능한 환경에 집중하며, 연합 학습은 이를 가능하게 하는 핵심 메커니즘입니다.
연합 학습은 여러 디바이스에 걸쳐 학습을 분산시킨 다음, 모델 업데이트를 중앙 제어 평면으로 모아 새로운 글로벌 모델로 통합합니다. 각 디바이스는 자체 로컬 환경을 이해함으로써 이점을 얻고, 전체 플릿은 집단 지능을 통해 혜택을 받습니다. 데이터는 원래 있던 곳에 머물며 오직 모델이 학습한 내용만이 전송됩니다.
Scaleout의 작업은 국방, 산업, 운송 및 기타 규제 분야를 아우르며, NATO DIANA 액셀러레이터 프로그램 및 BAE Systems와의 협업과 같은 프로젝트를 포함합니다. 이 모든 사례에서 데이터를 이동할 수 없으면서도 모델은 지속적으로 개선되어야 한다는 공통된 패턴이 나타납니다.
Link to this section엣지 머신러닝의 복잡성#
Scaleout이 현장에서 모델을 학습시킬 때 직면했던 제약 사항들을 자세히 살펴보겠습니다.
-
제한된 하드웨어: 현장 배치 시 데이터 센터 서버는 없으며 드론에 탑재된 컴퓨터와 같은 소형의 저전력 디바이스만 존재합니다. 완성된 모델을 실행하는 것은 가능하지만, 모델을 재학습시키는 데는 훨씬 더 많은 컴퓨팅 자원이 필요합니다.
-
디바이스에 잠긴 데이터: 재학습에 필요한 영상은 종종 기밀이며 중앙 서버로 보낼 수 없으므로, 모델은 엣지 밖으로 나가지 않는 데이터를 기반으로 학습해야 합니다.
-
현장 전문가 부재: 현장에서 데이터를 수집하는 운영자는 머신러닝 엔지니어가 아닌 경우가 많으므로, 재학습은 데이터 사이언스 전문 지식의 현장 상주에 의존할 수 없습니다.
-
끊임없이 변하는 조건: 현장 환경은 빠르게 변화하므로 느리고 주기적인 재학습 사이클이 아닌 지속적인 모델 업데이트가 필요합니다.
Link to this section엣지에서 Ultralytics YOLO 모델 파인튜닝#
이러한 제약 조건 내에서 작업하기 위해 Scaleout은 Ultralytics YOLO 모델을 중심으로 현장에서 완전히 실행되는 학습 루프를 구축했습니다.
각 현장에는 자체 컴퓨팅 및 스토리지를 갖춘 GPU 가속 엣지 스테이션인 Vision Ground Node가 드론 플릿과 함께 배치됩니다. 드론이 영상을 캡처하면 노드가 가장 유용한 프레임을 선택하고 운영자가 라벨링을 수행하며, 해당 로컬 하드웨어에서 YOLO 모델이 파인튜닝됩니다.
몇 번의 학습 에포크(epoch)를 거친 후에는 원본 영상이 아닌 업데이트된 모델만 제어 평면으로 전송됩니다. 이 루프는 컴퓨터 비전 프로젝트에 필요한 도구를 단일 패키지로 묶은 Scaleout Edge 플랫폼의 확장 기능인 Scaleout 비전 모듈을 통해 제공됩니다.
이 모듈은 프레임 선택, 주석, 학습 및 배포를 통합하고 Ultralytics YOLO가 탐지를 담당하도록 하여, 팀이 이러한 구성 요소를 직접 조립할 필요 없이 작업 기반 위에서 효율적으로 구축할 수 있도록 합니다.
Scaleout은 NATO DIANA 액셀러레이터 프로그램에서 이 접근 방식을 처음 적용하여 YOLOv8을 사용해 현장에서 수집된 데이터에 대한 탐지 성능을 파인튜닝했습니다. 해당 데이터는 현장 네트워크를 통해 이동하거나 보안상의 이유로 중앙화될 수 없었기 때문에, 팀은 파인튜닝 과정을 분산화하여 모델이 로컬에서 새로운 사례를 학습하도록 했습니다.
이 루프는 데이터 사이언티스트가 아닌 운영자를 위해 구축되었습니다. 시스템은 비전문가가 중요한 프레임을 검토하고 라벨링하도록 안내하므로 현장의 인력들이 스스로 모델을 계속 개선할 수 있습니다.
이를 지원하는 도구로는 주석 작업을 위한 오픈 소스 버전의 Label Studio, 드론 피드를 가져오기 위한 스트리밍 서버, 파인튜닝을 위한 Ultralytics Python 패키지가 있습니다. 이 모든 구성 요소는 배포 환경에 따라 NVIDIA Jetson 모듈부터 견고한 현장용 장비나 노트북에 이르기까지 다양한 하드웨어에서 실행됩니다.
Link to this section왜 Ultralytics YOLO 모델인가?#
Scaleout에게 Ultralytics YOLO의 가장 큰 장점은 모델이 매우 가볍다는 점이며, 이는 열악한 연결 환경에서도 연합 학습을 실용적으로 만드는 핵심 요소입니다. Scaleout은 원본 데이터를 이동시키는 대신 모델 업데이트만 전송합니다. 가장 많이 사용하는 Ultralytics YOLOv8 nano 모델은 약 10.7MB이므로, 대역폭이 부족한 상황에서도 전체 업데이트 패키지를 쉽게 보낼 수 있습니다.
Ultralytics Python 패키지는 또한 Scaleout 엔지니어들에게 다양한 하드웨어에 걸쳐 학습 및 배포할 수 있는 유연성을 제공합니다. 소형 YOLOv8 nano 모델은 제약이 있는 엣지 디바이스에서도 원활하게 실행되며, 패키지의 내보내기 옵션은 Scaleout이 작업하는 여러 환경 전반에 걸친 배포를 지원합니다. 모델의 파인튜닝이 간편하기 때문에 팀은 현장 조건 변화에 빠르게 대응하여 반복 작업을 수행할 수 있습니다.
Link to this sectionUltralytics YOLO를 통해 더 빠르게 모델을 업데이트하는 Scaleout#
Ultralytics YOLO를 사용하면 작업 중 가장 무거운 부분은 디바이스 내부에 남습니다. 수백 기가바이트의 현장 영상에 대해 학습이 이루어지지만, 실제로 이동하는 것은 약 10MB 크기의 모델뿐입니다. 이는 이동해야 하는 데이터 양을 약 10분의 1로 줄여주며, 이 덕분에 해당 배포 환경이 의존하는 제한된 네트워크상에서도 연합 학습이 가능해집니다.
이러한 접근 방식은 향상된 모델이 현장에 복귀하는 속도도 변화시킵니다. 데이터를 수집하고 중앙 서버로 전송하며 재학습하고 다시 배포하는 과정이 보통 수주에서 수개월이 걸릴 수 있지만, 엣지에서 루프가 실행되면 수 일에서 수 시간으로 단축됩니다.
이 효과는 Scaleout의 드론 작업에서 가장 명확하게 드러납니다. 국방 정찰에서 드론은 탐색 패턴을 따라 비행하며 온보드 Ultralytics YOLO 모델을 사용하여 관심 대상체를 실시간으로 탐지, 식별 및 지리적 위치를 파악합니다. 이 모든 처리는 외부 분석을 위해 전송되는 것이 아니라 드론 자체 컴퓨터에서 처리됩니다.
드론이 새로운 영상을 수집하면 해당 데이터는 Vision Ground Node로 전달되어 새로운 프레임에서 YOLO가 파인튜닝되고, 영상은 현장을 전혀 떠나지 않은 상태에서 업데이트된 모델이 다시 배포됩니다. 탐지 모델은 빠르게 변화하는 조건과 이동할 수 없는 데이터를 따라잡아야 하며, 현장에서 로컬로 재학습된 모델은 정적으로 중앙에서 학습된 모델이 뒤처질 수 있는 상황에서도 유용함을 유지합니다.

Fig 1. Scaleout과 Ultralytics YOLO가 AI 드론을 구동하는 방식의 예시 (출처)
이 동일한 패턴은 드론을 훨씬 넘어섭니다. 에너지 현장이나 원격 시설과 같이 데이터가 민감한 산업 환경에서 이 플랫폼은 원시 데이터가 시설 경계를 넘지 않고도 여러 사이트에 걸쳐 탐지 모델을 개선합니다. 데이터가 드론에 있든 고정식 설치물에 있든 상관없이, Scaleout은 영상을 현장에 유지하고 모델이 학습한 내용만 이동시킵니다.
Link to this section데이터를 이동할 수 없는 환경을 위한 적응형 AI 구축#
Scaleout은 성장함에 따라 연합형 엣지 기반 컴퓨터 비전을 더 많은 환경과 하드웨어로 확장하고 있습니다. 사전 구축된 모듈은 수개월의 통합 과정을 며칠로 단축하도록 설계되어, 고객이 기존 머신러닝 코드를 다시 작성하지 않고도 자신의 하드웨어를 가져와 적응형 학습 루프를 채택할 수 있게 합니다.
탐지 파이프라인의 핵심에 Ultralytics YOLO를 탑재한 Scaleout은 기존 접근 방식이 실패하는 바로 그 환경에서 AI를 학습하고 개선할 수 있도록 하여, 데이터를 제자리에 유지하고 네트워크 실패 시에도 운영 상태를 유지하며 엣지 디바이스 플릿 전체가 지속적으로 학습하는 시스템으로 변모시키고 있습니다.
Vision AI가 제공할 수 있는 가능성을 탐색할 준비가 되셨습니까? GitHub 저장소를 방문하여 YOLO 모델이 제조 분야 AI 및 로봇 공학 컴퓨터 비전과 같은 영역을 어떻게 혁신하고 있는지 알아보세요. 라이선스 옵션을 확인하고 더 스마트한 자동화를 향한 여정을 시작하십시오.






