YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

벡터 데이터베이스

벡터 데이터베이스가 지능형 시스템을 위한 효율적인 유사성 검색, 시맨틱 검색 및 이상 감지를 가능하게 함으로써 AI에 혁명을 일으키는 방법을 알아보세요.

벡터 데이터베이스는 벡터 임베딩으로 알려진 고차원 데이터를 저장, 관리 및 검색하도록 설계된 특수 유형의 데이터베이스입니다. 구조화된 데이터와 정확한 일치를 위해 최적화된 기존 관계형 데이터베이스와 달리 벡터 데이터베이스는 유사성을 기반으로 항목을 찾는 데 탁월합니다. 이러한 기능은 추천 엔진에서 시각적 검색에 이르기까지 광범위한 최신 AI 애플리케이션에 기본적이며 머신 러닝 인프라에서 중요한 구성 요소가 됩니다. 이는 AI 모델의 장기 기억 역할을 하여 학습 중에 학습된 복잡한 패턴을 활용할 수 있도록 합니다.

벡터 데이터베이스 작동 원리

벡터 데이터베이스의 핵심 기능은 벡터 검색을 효율적으로 실행하는 것입니다. 이 프로세스는 이미지, 텍스트 블록 또는 오디오 클립과 같은 비정형 데이터가 딥러닝 모델을 통과하여 벡터 임베딩이라는 숫자 표현을 생성할 때 시작됩니다. 이러한 임베딩은 원본 데이터의 의미론적 의미를 캡처합니다.

벡터 데이터베이스는 이러한 임베딩을 저장하고 특수 알고리즘을 사용하여 인덱싱합니다. 쿼리가 이루어지면(예: 이미지로 검색), 쿼리 데이터도 벡터로 변환됩니다. 그런 다음 데이터베이스는 코사인 유사도 또는 유클리드 거리와 같은 유사성 메트릭을 사용하여 이 쿼리 벡터를 저장된 벡터와 비교하여 '가장 가까운' 또는 가장 유사한 항목을 찾습니다. 수백만 또는 수십억 개의 벡터로 이 작업을 수행하기 위해 그들은 종종 매우 효율적인 근사 최근접 이웃(ANN) 알고리즘에 의존합니다.

실제 애플리케이션

벡터 데이터베이스는 사용자가 매일 상호 작용하는 많은 지능형 기능을 지원합니다.

  1. 전자 상거래에서의 시각적 검색: 사용자는 마음에 드는 제품 사진을 업로드할 수 있습니다. Ultralytics YOLO11 모델과 같은 컴퓨터 비전 모델은 이미지에 대한 임베딩을 생성합니다. 이 임베딩은 전체 제품 카탈로그에 대한 임베딩을 포함하는 전자 상거래 사이트의 벡터 데이터베이스를 쿼리하는 데 사용됩니다. 데이터베이스는 가장 유사한 벡터를 반환하여 사이트에서 시각적으로 동일하거나 스타일이 관련된 제품을 표시할 수 있도록 합니다. 이는 소매업 AI의 핵심 기능입니다.
  2. 문서에 대한 시맨틱 검색: 회사는 보고서 및 지원 티켓과 같은 모든 내부 문서에 대한 임베딩을 만들 수 있습니다. 그러면 직원은 특정 키워드 대신 "지난 분기 수익은 얼마였습니까?"와 같은 자연어 질문을 사용하여 검색할 수 있습니다. 자연어 처리(NLP) 모델은 이 쿼리를 임베딩으로 변환하고 벡터 데이터베이스는 의미상 가장 가까운 임베딩을 가진 문서를 찾아 정확한 문구가 일치하지 않더라도 관련 정보를 제공합니다. 이는 검색 증강 생성(RAG) 시스템의 핵심 구성 요소입니다.

벡터 데이터베이스 vs. 관련 개념

벡터 데이터베이스를 밀접하게 관련된 용어와 구별하는 것이 유용합니다.

  • 임베딩: 임베딩은 데이터의 벡터 표현입니다. 벡터 데이터베이스는 이러한 임베딩을 효율적으로 저장, 인덱싱 및 쿼리하도록 구축된 특수 시스템입니다. 임베딩을 책으로, 벡터 데이터베이스를 책을 정리하는 지능형 라이브러리로 생각하십시오.
  • 벡터 검색: 벡터 검색은 데이터 세트에서 가장 유사한 벡터를 찾는 프로세스입니다. 벡터 데이터베이스는 특히 실시간 추론을 위해 이 프로세스를 빠르고 확장 가능하게 만드는 기본 기술입니다.

이러한 구성 요소는 완전한 MLOps 워크플로의 일부로 관리되며, 종종 엔드 투 엔드 모델 및 데이터 세트 관리를 위해 Ultralytics HUB와 같은 플랫폼에서 지원됩니다.

인기 있는 벡터 데이터베이스

확장성, 배포 및 기능과 관련하여 각각 다른 강점을 가진 여러 오픈 소스 및 상용 벡터 데이터베이스를 사용할 수 있습니다. 가장 널리 사용되는 데이터베이스는 다음과 같습니다.

  • Pinecone: 널리 사용되는 완전 관리형 벡터 데이터베이스 서비스입니다.
  • Milvus: 고성능 및 확장성을 위해 설계된 오픈 소스 벡터 데이터베이스입니다.
  • Weaviate: 그래프 기능을 갖춘 오픈 소스, AI 네이티브 데이터베이스입니다.
  • Chroma DB: 간결성과 개발자 경험에 중점을 둔 오픈 소스 임베딩 데이터베이스입니다.
  • Qdrant: 성능과 안전을 위해 Rust로 작성된 오픈 소스 벡터 데이터베이스 및 유사성 검색 엔진입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.