이벤트

생성형 AI가 컴퓨터 비전의 향후 방향을 바꾸고 있습니다

YOLO Vision 2024 패널 토크에서 흥미로운 통찰력을 발견하십시오. 생성형 AI가 실시간 Vision AI 모델의 향후 방향을 어떻게 형성하고 있는지 탐구합니다.

ABAbirami Vina

5 min readMarch 24, 2025

YOLO Vision 2024의 생성형 AI 및 Vision AI에 관한 패널 토론

생성형 AI는 기존 데이터에서 패턴을 학습하여 이미지, 텍스트 또는 오디오와 같은 새로운 콘텐츠를 만들어내는 인공지능(AI)의 한 분야입니다. 최근의 발전 덕분에 이제는 인간의 창의성을 모방하는 매우 사실적인 콘텐츠를 제작하는 데 사용될 수 있습니다.

그러나 생성형 AI의 영향력은 단순히 콘텐츠 제작을 넘어섭니다. Ultralytics YOLO 모델과 같은 실시간 컴퓨터 비전 모델이 계속 발전함에 따라, 생성형 AI는 시각 데이터가 처리되고 증강되는 방식을 재정의하며 실제 시나리오에서 혁신적인 애플리케이션을 위한 길을 열고 있습니다.

이러한 새로운 기술적 변화는 Ultralytics가 주최하는 연례 하이브리드 이벤트인 YOLO Vision 2024 (YV24)에서 흥미로운 대화 주제였습니다. YV24에서는 AI 애호가와 업계 리더들이 모여 컴퓨터 비전 분야의 최신 돌파구에 대해 논의했습니다. 이번 행사는 혁신, 효율성, 그리고 실시간 AI 솔루션의 미래에 초점을 맞췄습니다.

이번 행사의 주요 하이라이트 중 하나는 생성형 AI 시대의 YOLO에 관한 패널 토크였습니다. 이 패널에는 Ultralytics의 창립자이자 CEO인 Glenn Jocher, Ultralytics의 수석 머신 러닝 엔지니어인 Jing Qiu, 그리고 칭화대학교의 Ao Wang이 참여했습니다. 그들은 생성형 AI가 컴퓨터 비전에 미치는 영향과 실용적인 AI 모델 구축의 과제에 대해 탐구했습니다.

이 글에서는 그들의 논의에서 얻은 핵심 통찰력을 되짚어보고, 생성형 AI가 어떻게 비전 AI를 변화시키고 있는지 자세히 살펴보겠습니다.

Link to this sectionUltralytics YOLO 모델 개발#

Glenn Jocher와 함께 많은 숙련된 엔지니어들이 Ultralytics YOLO 모델을 개발하는 데 중요한 역할을 했습니다. 그중 한 명인 Jing Qiu는 YOLO와의 예상치 못한 시작을 회상했습니다. 그는 대학 시절 AI에 대한 열정이 시작되었다고 설명했습니다. 그는 이 분야를 탐구하고 배우는 데 상당한 시간을 보냈습니다. Jing Qiu는 GitHub에서 Glenn Jocher와 어떻게 연결되어 다양한 AI 프로젝트에 참여하게 되었는지 이야기했습니다.

Jing Qiu의 말에 덧붙여 Glenn Jocher는 GitHub를 "놀라운 공유 방식"이라고 묘사하며, "한 번도 만난 적 없는 사람들이 서로 돕고 각자의 작업에 기여하는 곳입니다. 훌륭한 커뮤니티이자 AI를 시작하는 정말 좋은 방법입니다"라고 설명했습니다.

YV24 무대에서 연설 중인 Glenn Jocher와 Jing Qiu

그림 1. YV24 무대에서 발표하는 Glenn Jocher와 Jing Qiu.

Jing Qiu의 AI에 대한 관심과 Ultralytics YOLOv5 작업은 모델을 개선하는 데 도움이 되었습니다. 이후 그는 추가적인 개선 사항을 도입한 Ultralytics YOLOv8 개발에 핵심적인 역할을 했습니다. 그는 이를 놀라운 여정이라고 묘사했습니다. 오늘날 Jing Qiu는 Ultralytics YOLO11과 같은 모델을 계속 개선하고 작업하고 있습니다.

Link to this sectionYOLOv10: 실세계 성능을 위해 최적화됨#

중국에서 원격으로 패널 토크에 참여한 Ao Wang은 자신을 박사 과정 학생으로 소개했습니다. 처음에는 소프트웨어 엔지니어를 공부했지만, AI에 대한 열정으로 컴퓨터 비전과 딥러닝으로 방향을 전환했습니다.

그가 유명한 YOLO 모델을 처음 접한 것은 다양한 AI 기술과 모델을 실험할 때였습니다. 그는 속도와 정확성에 깊은 인상을 받았고, 이는 객체 감지와 같은 컴퓨터 비전 작업을 더 깊이 연구하도록 영감을 주었습니다. 최근 Ao Wang은 최신 YOLO 모델 버전인 YOLOv10에 기여했습니다. 그의 연구는 모델을 더 빠르고 정확하게 최적화하는 데 중점을 두었습니다.

Link to this section생성형 AI와 비전 AI의 주요 차이점#

패널들은 생성형 AI에 대해 논의를 시작했고, Jing Qiu는 생성형 AI와 비전 AI가 매우 다른 목적을 가지고 있다고 지적했습니다. 생성형 AI는 텍스트, 이미지, 비디오와 같은 것을 창조하거나 생성하는 반면, 비전 AI는 주로 이미지를 통해 이미 존재하는 것을 분석합니다.

Glenn Jocher는 규모 또한 큰 차이점이라고 강조했습니다. 생성형 AI 모델은 거대하며, 종종 수십억 개의 매개변수(모델이 데이터로부터 학습하는 것을 돕는 내부 설정)를 포함합니다. 컴퓨터 비전 모델은 훨씬 더 작습니다. 그는 "우리가 보유한 가장 작은 YOLO 모델은 가장 작은 LLM[거대 언어 모델]보다 약 1,000배 더 작습니다. 즉, 30억 개의 매개변수와 비교하여 300만 개의 매개변수를 갖는 것입니다"라고 말했습니다.

YV24에서 생성형 AI와 Vision AI에 대해 진행된 패널 토론

그림 2. YV24에서 열린 생성형 AI와 비전 AI에 관한 패널 토론.

Jing Qiu는 생성형 AI와 컴퓨터 비전의 학습 및 배포 프로세스 또한 매우 다르다고 덧붙였습니다. 생성형 AI는 실행하기 위해 거대하고 강력한 서버가 필요합니다. 반면 YOLO와 같은 모델은 효율성을 위해 구축되었으며 표준 하드웨어에서 학습되고 배포될 수 있습니다. 이것이 Ultralytics YOLO 모델을 실사용에 더 실용적으로 만듭니다.

비록 다르지만, 이 두 분야는 서로 얽히기 시작했습니다. Glenn Jocher는 생성형 AI가 비전 AI에 새로운 발전을 가져와 모델을 더 똑똑하고 효율적으로 만들고 있다고 설명했습니다.

Link to this section생성형 AI가 컴퓨터 비전에 미치는 영향#

생성형 AI는 빠르게 발전했으며, 이러한 돌파구는 컴퓨터 비전을 포함한 다른 많은 인공지능 분야에 영향을 미치고 있습니다. 다음으로, 패널들의 매혹적인 통찰력을 살펴보겠습니다.

Link to this section하드웨어 발전이 AI 혁신을 가능하게 하다#

패널 초반에 Glenn Jocher는 머신 러닝 아이디어가 오랫동안 존재해 왔지만, 컴퓨터가 이를 작동시킬 만큼 강력하지 않았다고 설명했습니다. AI 아이디어가 현실이 되려면 더 강력한 하드웨어가 필요했습니다.

지난 20년 동안 병렬 처리 기능을 갖춘 GPU(그래픽 처리 장치)의 등장은 모든 것을 바꾸었습니다. GPU는 AI 모델 학습을 훨씬 빠르고 효율적으로 만들었으며, 이는 딥러닝이 빠른 속도로 발전할 수 있게 했습니다.

오늘날, TPU(텐서 처리 장치)와 최적화된 GPU 같은 AI 칩은 더 크고 복잡한 모델을 다루면서도 더 적은 전력을 사용합니다. 이는 AI를 더욱 접근하기 쉽게 만들고 실세계 애플리케이션에서 유용하게 만들었습니다.

새로운 하드웨어 개선이 있을 때마다 생성형 AI와 컴퓨터 비전 애플리케이션은 더욱 강력해지고 있습니다. 이러한 발전은 실시간 AI를 더 빠르고 효율적으로 만들며, 더 많은 산업 분야에서 사용할 수 있게 합니다.

Link to this section생성형 AI가 객체 감지 모델을 형성하는 방법#

생성형 AI가 컴퓨터 비전에 어떤 영향을 미치는지 묻는 질문에 Jing Qiu는 AI가 이미지의 가장 중요한 부분에 집중하도록 돕는 모델인 트랜스포머가 AI가 이미지를 이해하고 처리하는 방식을 바꾸었다고 말했습니다. 첫 번째 큰 단계는 객체 감지를 위해 이 새로운 접근 방식을 사용한 DETR(Detection Transformer)이었습니다. 이는 정확도를 향상시켰지만 일부 경우 속도가 느려지는 성능 문제를 겪었습니다.

이를 해결하기 위해 연구자들은 RT-DETR과 같은 하이브리드 모델을 만들었습니다. 이 모델들은 합성곱 신경망(CNN, 이미지에서 특징을 자동으로 학습하고 추출하는 딥러닝 모델)과 트랜스포머를 결합하여 속도와 정확성 사이의 균형을 맞춥니다. 이 접근 방식은 트랜스포머의 이점을 활용하면서도 객체 감지를 더 빠르게 만듭니다.

흥미롭게도, YOLOv10은 트랜스포머 기반 어텐션 레이어(이미지에서 가장 중요한 영역을 강조하기 위해 스포트라이트처럼 작동하고 덜 중요한 세부 사항은 무시하는 모델의 부분)를 사용하여 성능을 향상시킵니다.

Ao Wang은 생성형 AI가 모델 학습 방식을 어떻게 변화시키는지에 대해서도 언급했습니다. 마스크된 이미지 모델링과 같은 기술은 AI가 이미지로부터 더 효율적으로 학습하도록 도와, 대규모의 수동 라벨링 데이터셋에 대한 필요성을 줄여줍니다. 이는 컴퓨터 비전 학습을 더 빠르고 리소스 집약적이지 않게 만듭니다.

Link to this section생성형 AI와 비전 AI의 미래#

패널이 논의한 또 다른 핵심 아이디어는 생성형 AI와 비전 AI가 더 유능한 모델을 구축하기 위해 어떻게 결합될 수 있는지였습니다. Glenn Jocher는 이 두 가지 접근 방식이 각기 다른 강점을 가지고 있지만, 결합하면 새로운 가능성을 열 수 있다고 설명했습니다.

예를 들어, YOLO와 같은 비전 AI 모델은 종종 이미지를 그리드로 나누어 객체를 식별합니다. 이러한 그리드 기반 방식은 언어 모델이 세부 정보를 정확히 찾아내고 설명하는 능력을 향상시키는 데 도움이 될 수 있는데, 이는 오늘날 많은 언어 모델이 직면한 과제입니다. 본질적으로, 이러한 기술들을 병합하면 그들이 보는 것을 정확하게 감지하고 명확하게 설명할 수 있는 시스템으로 이어질 수 있습니다.

생성형 AI와 Vision AI의 미래

그림 3. 생성형 AI와 비전 AI의 미래. 이미지 제공: 저자.

Link to this section핵심 요약#

생성형 AI와 컴퓨터 비전은 함께 발전하고 있습니다. 생성형 AI는 이미지와 비디오를 생성할 뿐만 아니라, 비전 AI 모델을 더 정확하고 효율적으로 만들 수 있는 혁신적인 아이디어를 제공함으로써 이미지 및 비디오 분석을 개선합니다.

이 통찰력 있는 YV24 패널 토크에서 Glenn Jocher, Jing Qiu, Ao Wang은 이러한 기술이 미래를 어떻게 형성하고 있는지에 대한 생각을 공유했습니다. 더 나은 AI 하드웨어와 함께 생성형 AI와 비전 AI는 계속 발전하여 더 큰 혁신을 이끌 것입니다. 이 두 분야는 일상 생활을 위한 더 똑똑하고 빠르며 유용한 AI를 만들기 위해 협력하고 있습니다.

우리 커뮤니티에 가입하고 GitHub 저장소를 탐색하여 비전 AI에 대해 더 자세히 알아보세요. 컴퓨터 비전 프로젝트를 시작하려면 라이선스 옵션을 확인하세요. 제조 분야의 AI나 자율주행 컴퓨터 비전과 같은 혁신에 관심이 있으신가요? 솔루션 페이지를 방문하여 더 많은 정보를 확인해 보세요.

Explore solutions

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

생성형 AI가 컴퓨터 비전의 향후 방향을 바꾸고 있습니다

Link to this sectionUltralytics YOLO 모델 개발#

Link to this sectionYOLOv10: 실세계 성능을 위해 최적화됨#

Link to this section생성형 AI와 비전 AI의 주요 차이점#

Link to this section생성형 AI가 컴퓨터 비전에 미치는 영향#

Link to this section하드웨어 발전이 AI 혁신을 가능하게 하다#

Link to this section생성형 AI가 객체 감지 모델을 형성하는 방법#

Link to this section생성형 AI와 비전 AI의 미래#

Link to this section핵심 요약#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!