용어집

TinyML

TinyML을 살펴보고 저전력 마이크로컨트롤러에 Ultralytics 배포하는 방법을 배워보세요. 양자화 기술과 Ultralytics 활용해 IoT용 모델을 최적화하는 방법을 알아보세요.

일반적으로 TinyML로 불리는 ‘소형 머신러닝(Tiny Machine Learning)’은 마이크로컨트롤러나 소형 IoT 기기와 같이 초저전력이며 자원이 제한된 기기에 모델을 배포하는 데 중점을 둔 머신러닝의 특화된 하위 분야입니다. 막대한 연산 자원에 의존하는 기존의 클라우드 기반 시스템과 달리, TinyML은 전적으로 에지에서 작동합니다. 종종 단 몇 밀리와트에 불과한 전력 제약이 있는 장치에서 지능형 알고리즘을 로컬로 실행함으로써, 이 접근 방식은 지연 시간을 최소화하고, 데이터 프라이버시를 보장하며, 대역폭 사용량을 대폭 줄여줍니다. 이는 TinyML 재단과 같은 커뮤니티가 지원하고 발전시켜 온 패러다임입니다.

복잡한 신경망 아키텍처를 ARM Cortex-M 프로세서와 같이 자원이 매우 제한적인 하드웨어에 성공적으로 적용하려면, 모델을 철저하게 최적화해야 합니다. 32비트 부동소수점 가중치를 8비트 정수로 변환하는 모델 양자화나 모델 프루닝과 같은 기법을 사용하여 전체 메모리 사용량을 대폭 줄입니다. 오늘날 Google TensorFlow for Microcontrollers나 PyTorch ExecuTorch와 같은 전문 프레임워크는 이러한 정밀한 압축 워크플로를 지원하여, 일상적인 임베디드 하드웨어에 첨단 시각 및 청각 지능을 제공합니다.

TinyML 대 엣지 AI

TinyML은 엣지 AI와 밀접한 관련이 있지만, 두 개념의 주요 차이점은 하드웨어 규모와 전력 소비량에 있습니다. 엣지 AI는 AI 모델의 모든 로컬 실행을 포괄하는 더 광범위한 용어로, 주로 라즈베리 파이 ( Raspberry Pi )와 같은 싱글보드 컴퓨터나 NVIDIA ( NVIDIA )과 같은 고성능 임베디드 GPU를 활용합니다. 반면, TinyML은 아두이노 보드나 ST마이크로일렉트로닉스 칩과 같이 배터리로 수개월 또는 수년 동안 작동하는 심층 임베디드 시스템을 특정 대상으로 합니다. 이러한 장치들은 일반적으로 수백 킬로바이트의 RAM만 갖추고 있어, 모델을 적극적으로 압축하는 것이 필수적입니다.

실제 애플리케이션

최소한의 하드웨어에 직접 AI를 적용할 수 있게 됨에 따라 다양한 산업 분야에서 수많은 실질적인 활용 사례가 등장했습니다:

스마트 제조 분야의 예측 유지보수: 공장에서는 초저전력 진동 및 오디오 센서를 기계에 직접 장착합니다. 이러한 TinyML 센서는 모터 주파수를 지속적으로 분석하여 고장 징후를 나타내는 detect 이상 징후를 detect , 유지보수 팀이 막대한 비용이 드는 가동 중단이 발생하기 전에 문제를 해결할 수 있도록 합니다.
스마트 정밀 농업: 배터리로 구동되는 TinyML 기기들이 광활한 농경지 곳곳에 배치되어 기본적인 카메라 모듈을 활용해 국지적인 환경 조건을 모니터링하고 detect 해충 침입이나 질병의 초기 징후를 detect , 대용량 이미지 파일 대신 가벼운 알림만 전송합니다.
야생동물 보호를 위한 음향 모니터링: 연구진은 TinyML로 구동되는 은폐형 음향 센서 어레이를 활용해 울창한 숲 속에서 멸종 위기 종의 특유 detect 불법 벌목 활동(예: 전기톱 detect ) detect . 태양광이나 배터리로 작동하는 이 장치들은 현장에서 음향을 분석하고 즉시 장거리 경보를 발령합니다.

TinyML용 모델 내보내기

마이크로컨트롤러용 모델을 준비하려면 엄격한 내보내기 형식 규정을 준수해야 합니다. Ultralytics 사용하면 개발자는 강력한 물체 탐지 파이프라인을 구축하고 이를 임베디드 대상 시스템에 맞게 압축할 수 있습니다. 로컬로 내보내기 전에 Ultralytics 데이터셋과 모델 버전 관리를 원활하게 수행할 수 있습니다. 네이티브 TFLite 통해 마이크로컨트롤러에 필요한 8비트 정수 형식으로 손쉽게 변환할 수 있으며, 이는 Apple의 CoreML, Google Edge TPU, NVIDIA TensorRT과 같은 다른 하드웨어 전용 모델 배포 옵션을 보완합니다.

다음 예제는 INT8 양자화로 특별히 최적화된 경량 YOLO26 모델을 내보내는 방법을 보여줍니다. 이를 통해 TinyML 호환 에지 플랫폼에 배포하기에 적합합니다:

from ultralytics import YOLO

# Initialize the lightweight YOLO26 Nano model for edge use cases
model = YOLO("yolo26n.pt")

# Export to TFLite format with INT8 quantization and a reduced image size
# This minimizes the memory footprint and accelerates inference on microcontrollers
model.export(format="tflite", int8=True, imgsz=160)

TinyML

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

TinyML 대 엣지 AI

실제 애플리케이션

TinyML용 모델 내보내기

이 카테고리에서 더 읽어보기

Ultralytics 활용한 폴리곤 주석 달기 가이드

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

함께 AI의 미래를 만들어 갑시다!

TinyML

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

TinyML 대 엣지 AI

실제 애플리케이션

TinyML용 모델 내보내기

이 카테고리에서 더 읽어보기

Ultralytics 활용한 폴리곤 주석 달기 가이드

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

함께 AI의 미래를 만들어 갑시다!

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.