고객 스토리로 돌아가기

Prezent는 슬라이드 요소를 감지하기 위해 Ultralytics YOLO 모델을 사용합니다.

문제

기존 도구는 느리고 불안정하며 종종 디자인을 보존하지 못했기 때문에 Prezent는 슬라이드 구조를 자동으로 감지할 수 있는 Vision AI 솔루션이 필요했습니다.

솔루션

Prezent는 Ultralytics YOLO 모델을 통해 정확도를 65%에서 87%로 개선하고, 교육 시간을 3일에서 1일로 단축했으며, 슬라이드 처리 시간을 10초 이내로 단축했습니다.

프레젠테이션은 비즈니스 미팅에서 명확한 의사소통의 핵심이지만, 영향력 있고 유익한 정보를 제공하기 위해 프레젠테이션을 다시 디자인하는 것은 쉽지 않은 일입니다. Prezent는 AI를 사용하여 제목, 텍스트, 이미지, 차트와 같은 슬라이드 요소를 감지하고 이해하여 재디자인된 슬라이드가 명확하고 시각적으로 매력적이며 따라 하기 쉽도록 합니다.

슬라이드 요소 감지를 위한 다양한 도구를 테스트한 결과, Prezent는 레이아웃과 정보 계층 구조가 흐트러져 프레젠테이션의 일관성이 떨어지는 경우가 많다는 사실을 발견했습니다. Prezent는 Ultralytics YOLO 모델을 통합함으로써 프로세스를 간소화하여 최소한의 노력으로 슬라이드 요소를 더 빠르고 매끄럽고 전문적으로 감지할 수 있게 되었습니다.

AI로 더 빠르고 스마트하게 슬라이드 재설계하기

프리젠트는 재설계 프로세스를 자동화하여 최고 경영진과 비즈니스 팀이 명확하고 전문적인 프레젠테이션을 만들 수 있도록 지원합니다. 기존에는 수동 템플릿과 사람의 노력에 의존했기 때문에 속도가 느리고 비효율적이었습니다. 

효율성을 개선하기 위해 Prezent는 원본 레이아웃을 유지하면서 슬라이드 서식을 자동화하기 위해 AI와 컴퓨터 비전을 도입했습니다. 이제 이 플랫폼은 객체 감지 모델을 사용하여 슬라이드 콘텐츠를 자동으로 감지하고 구성하여 최소한의 사용자 입력으로 더 빠르고 원활하게 재설계 프로세스를 진행할 수 있습니다. 이를 통해 Prezent는 프레젠테이션이 명확하고 시각적으로 매력적이며 따라 하기 쉬운 상태로 유지되도록 합니다.

AI 기반 슬라이드 재설계의 장애물

훌륭한 프레젠테이션은 단순히 정보만 전달하는 것이 아니라 명확성, 구조, 임팩트가 중요합니다. 하지만 슬라이드를 수동으로 재디자인하여 더 매력적인 프레젠테이션을 만들려면 시간과 노력이 필요합니다. 회의에서 프레젠테이션에 자주 의존하는 최고 경영진과 비즈니스 팀에게는 느리고 답답한 재디자인 프로세스가 큰 과제였습니다.

Prezent는 슬라이드 재설계를 자동화하기 시작했지만, 모든 요소를 제자리에 유지하면서 슬라이드 요소를 어떻게 감지하고 재구성할 것인가라는 중요한 장애물이 있었습니다. 기존 도구는 텍스트를 추출할 수는 있지만 제목, 이미지, 차트의 배열 방식을 인식하지 못해 레이아웃을 방해하는 경우가 많았습니다.

처음에는 오픈 소스 오브젝트 감지 모델을 사용했지만 이러한 방법에는 낮은 정확도(60~65%), 느린 처리 시간, 여전히 수동 수정이 필요한 레이아웃이라는 한계가 있었습니다. 진정한 프로세스 자동화를 위해서는 슬라이드 요소를 정확하게 감지하고 구조를 손상시키지 않으면서 재설계할 수 있는 더 빠르고 스마트한 비전 AI 솔루션이 필요했습니다. 그래서 컴퓨터 비전과 AI를 도입하여 프로세스를 원활하게 만들었습니다.

슬라이드 요소 감지를 위한 Prezent의 비전 AI 솔루션

레이아웃을 그대로 유지하면서 슬라이드 재설계를 자동화하기 위해 Prezent는 Ultralytics YOLO 모델을 플랫폼에 통합했습니다. Ultralytics YOLO 모델은 객체 감지를 비롯한 다양한 컴퓨터 비전 작업을 지원합니다. 슬라이드는 이미지로 변환되고 YOLO는 원래 레이아웃을 그대로 유지하면서 제목, 텍스트 상자, 이미지 및 차트와 같은 주요 요소를 감지합니다. 

YOLO는 레이아웃 추출에서 중요한 역할을 수행하여 Prezent가 각 슬라이드의 구조와 계층 구조를 보존하는 동시에 빠르고 자동화된 재설계를 가능하게 합니다. 텍스트와 시각적 요소를 모두 인식하여 프레젠테이션의 기능성과 세련된 디자인을 모두 유지할 수 있도록 도와줍니다. 높은 정확도와 빠른 처리 속도를 자랑하는 YOLO는 슬라이드 요소 감지를 자동화하여 수동 조정의 필요성을 줄여줍니다.

울트라리틱스 YOLO 모델을 선택하는 이유는 무엇인가요?

Prezent는 다른 Vision AI 모델에 비해 더 빠르게 학습할 수 있고, 더 정확하며, 지연 시간이 짧다는 이유로 Ultralytics YOLO 모델을 선택했습니다. Prezent는 대부분의 모델이 훈련하는 데 2~3일이 걸리기 때문에 반복 작업과 개선 속도가 느리다는 사실을 발견했습니다. 

"일반적으로 머신 러닝 모델을 학습시키는 데는 엄청난 시간이 걸리며, 추론이 완료될 때까지 2~3일을 기다린 다음 정확도가 충분한지 결정해야 하는 경우가 많습니다. 하지만 YOLO를 사용하면 하루 만에 모델을 훈련하고, 신속하게 의사 결정을 내리고, 그 결과를 통해 빠르게 학습할 수 있습니다."라고 Prezent의 수석 데이터 과학자는 말합니다.

프리젠트의 정확도는 YOLO를 통해 65%에서 87%로 향상되었으며, 모델을 빠르게 개선하고 성능을 향상할 수 있었습니다. 또한 YOLO의 빠른 추론 속도로 10초 이내에 슬라이드 처리가 가능해져 실시간 자동화와 원활한 사용자 경험을 보장할 수 있게 되었습니다. 프리젠트는 YOLO를 통합함으로써 효율적이고 정확한 슬라이드 재설계를 위한 안정적이고 확장 가능한 솔루션을 찾았습니다.

YOLO로 10초 이내에 슬라이드 처리하기

Prezent는 Ultralytics YOLO 모델을 활용하여 슬라이드 재설계 프로세스를 더 빠르고 효율적이며 매우 정확하게 재정의했습니다. 슬라이드 요소를 자동으로 감지하고 구성하는 기능 덕분에 프레젠테이션은 수동 개입 없이도 원래의 구조, 명확성 및 시각적 매력을 유지할 수 있었습니다.

"Ultralytics YOLO를 사용하면 10초 이내에 완전히 처리된 슬라이드를 고객에게 제공할 수 있기 때문에 처리 속도도 뛰어납니다. 빠른 교육 시간과 짧은 지연 시간은 워크플로우를 간소화하고 재설계 품질을 개선하는 데 핵심적인 역할을 했습니다."라고 Prezent의 수석 데이터 과학자가 말했습니다.

프리젠트는 YOLO의 실시간 처리 기능을 통해 슬라이드 레이아웃 감지를 완전히 자동화하여 수동 재디자인의 비효율성을 제거할 수 있었습니다. 최고 경영진과 비즈니스 팀은 세련되고 전문적인 프레젠테이션을 즉시 생성하여 워크플로우 효율성과 사용자 경험을 개선할 수 있습니다. 컴퓨터 비전과 AI를 통합함으로써 Prezent는 생산성과 프레젠테이션 품질을 모두 향상시키는 확장 가능하고 자동화된 솔루션을 구축했습니다.

문서 분석에서 컴퓨터 비전이 나아갈 길

프리젠트는 컴퓨터 비전 모델이 더 복잡한 레이아웃을 처리하고 문서 구조에 대한 심층적인 통찰력을 제공하는 능력을 향상시키기를 원합니다. 이를 통해 더욱 정교하고 정확한 슬라이드 재설계가 가능해질 것입니다.

한 가지 잠재적인 개선 사항은 관련 요소를 하위 카테고리로 그룹화하는 기능입니다. 이러한 인사이트는 Vision AI 모델이 슬라이드 구성 요소 간의 계층 구조와 관계를 이해하는 데 도움이 됩니다. 결과적으로 새롭게 디자인된 슬라이드는 더 체계적이고 시각적으로 응집력이 있으며 따라가기 쉬워집니다.

전반적으로 프리젠트는 자동화 및 AI 기반 솔루션에 대한 수요가 증가함에 따라 컴퓨터 비전 모델은 더 복잡한 작업을 더 정확하고 빠르게 처리할 수 있도록 계속 발전할 것이라고 믿습니다. 

비전 AI로 비즈니스를 어떻게 개선할 수 있는지 궁금하신가요? 의료제조 분야의 컴퓨터 비전과 같은 다양한 산업을 위한 Ultralytics의 AI 솔루션을 확인하려면 GitHub 리포지토리를 방문하세요. 지금 바로 시작하는 데 도움이 되는 YOLO 모델과 라이선스 옵션에 대해 알아보세요!

산업별 솔루션

모두 보기

자주 묻는 질문

울트라리틱스 YOLO 모델이란 무엇인가요?

Ultralytics YOLO 모델은 이미지와 비디오 입력에서 시각적 데이터를 분석하기 위해 개발된 컴퓨터 비전 아키텍처입니다. 이러한 모델은 객체 감지, 분류, 포즈 추정, 추적 및 인스턴스 분할 등의 작업을 위해 학습할 수 있으며, Ultralytics YOLO 모델에는 다음이 포함됩니다:

  • Ultralytics YOLOv5
  • Ultralytics YOLOv8
  • Ultralytics YOLO11

Ultralytics YOLO 모델의 차이점은 무엇인가요?

Ultralytics YOLO11은 컴퓨터 비전 모델의 최신 버전입니다. 이전 버전과 마찬가지로 비전 AI 커뮤니티가 YOLOv8에 대해 사랑해 온 모든 컴퓨터 비전 작업을 지원합니다. 하지만 새로운 YOLO11은 더 뛰어난 성능과 정확성을 갖추고 있어 실제 업계에서 직면한 문제를 해결할 수 있는 강력한 도구이자 완벽한 지원군이 될 것입니다.

프로젝트에 어떤 Ultralytics YOLO 모델을 선택해야 하나요?

사용하기로 선택한 모델은 프로젝트의 특정 요구 사항에 따라 다릅니다. 성능, 정확성 및 배포 요구 사항과 같은 요소를 고려하는 것이 중요합니다. 다음은 간단한 개요입니다:

  • Ultralytics YOLOv8의 주요 기능 중 일부입니다:
  1. 성숙도와 안정성: YOLOv8은 입증된 안정적인 프레임워크로, 광범위한 문서와 이전 YOLO 버전과의 호환성을 갖추고 있어 기존 워크플로에 통합하는 데 이상적입니다.
  2. 사용 편의성: 초보자 친화적인 설정과 간단한 설치로 모든 기술 수준의 팀에 적합한 YOLOv8입니다.
  3. 비용 효율성: 더 적은 컴퓨팅 리소스를 필요로 하므로 예산에 민감한 프로젝트에 적합한 옵션입니다.
  • Ultralytics YOLO11의 주요 기능 중 일부입니다:
  1. 더 높은 정확도: 벤치마크에서 YOLO11은 더 적은 매개변수로 더 높은 정확도를 달성하여 YOLOv8보다 우수한 성능을 발휘합니다.
  2. 고급 기능: 포즈 추정, 오브젝트 추적, 방향성 바운딩 박스(OBB)와 같은 최첨단 작업을 지원하여 탁월한 활용성을 제공합니다.
  3. 실시간 효율성: 실시간 애플리케이션에 최적화된 YOLO11은 추론 시간을 단축하고 엣지 디바이스 및 지연 시간에 민감한 작업에서 탁월한 성능을 발휘합니다.
  4. 적응성: 광범위한 하드웨어 호환성을 갖춘 YOLO11은 엣지 디바이스, 클라우드 플랫폼 및 NVIDIA GPU 전반에 걸쳐 배포하는 데 적합합니다.

어떤 라이선스가 필요하나요?

YOLOv5 및 YOLO11과 같은 Ultralytics YOLO 리포지토리는 기본적으로 AGPL-3.0 라이선스에 따라 배포됩니다. 이 OSI 승인 라이선스는 학생, 연구자 및 애호가를 위해 설계되었으며, 개방형 협업을 장려하고 AGPL-3.0 구성 요소를 사용하는 모든 소프트웨어도 오픈 소스로 제공하도록 요구합니다. 이는 투명성을 보장하고 혁신을 촉진하지만 상업적 사용 사례에는 적합하지 않을 수 있습니다.
프로젝트에 상용 제품이나 서비스에 Ultralytics 소프트웨어 및 AI 모델을 포함시키고 AGPL-3.0의 오픈 소스 요구 사항을 우회하려는 경우, 엔터프라이즈 라이선스를 사용하는 것이 이상적입니다.

엔터프라이즈 라이선스의 혜택은다음과 같습니다:

  • 상업적 유연성: 프로젝트를 오픈소스화하기 위한 AGPL-3.0 요건을 준수하지 않고도 Ultralytics YOLO 소스 코드 및 모델을 수정하고 독점 제품에 포함할 수 있습니다.
  • 독점 개발: Ultralytics YOLO 코드 및 모델을 포함하는 상용 애플리케이션을 자유롭게 개발 및 배포할 수 있습니다.

원활한 통합을 보장하고 AGPL-3.0의 제약을 피하려면 제공된 양식을 사용하여 Ultralytics 엔터프라이즈 라이선스를 요청하세요. 고객의 특정 요구 사항에 맞게 라이선스를 조정하는 데 도움을 드릴 것입니다.

울트라틱스 YOLO로 파워업

프로젝트를 위한 고급 AI 비전을 확보하세요. 지금 바로 목표에 적합한 라이선스를 찾아보세요.

라이선스 옵션 살펴보기
링크가 클립보드에 복사됨