Yolo 비전 선전
선전
지금 참여하기
용어집

벡터 검색

벡터 검색이 NLP, 시각적 검색, 추천 시스템 등을 위한 데이터 검색에서 의미론적 유사성을 가능하게 함으로써 AI에 혁명을 일으키는 방법을 알아보세요!

벡터 검색은 데이터 세트 내에서 정확한 키워드 일치보다는 수학적 특성을 기반으로 수학적 특성을 기반으로 데이터 세트 내에서 유사한 항목을 식별하는 정교한 정보 검색 기법입니다. 텍스트, 이미지, 또는 오디오 등의 데이터를 고차원 숫자 벡터로 표현함으로써 임베딩으로 알려진 고차원 숫자 벡터로 표현함으로써, 이 방법을 사용하면 컴퓨터는 쿼리 뒤에 숨겨진 문맥과 의미적 의미를 이해할 수 있습니다. 기존의 키워드 검색과 달리 벡터 검색은 다차원 공간에서 항목 간의 근접성을 계산하여 문구가 서로 다른 경우에도 관련성이 높은 결과를 반환할 수 있습니다. 이 기능은 최신 인공 지능(AI)머신 러닝(ML) 시스템, 특히 비디오 피드와 같은 비정형 데이터 처리 및 자연어

벡터 검색의 작동 방식

벡터 검색의 핵심 메커니즘은 원시 데이터를 검색 가능한 숫자 형식으로 변환하는 것입니다. 이 프로세스는 딥 러닝 모델에 의존하여 특징 추출, 입력을 벡터 임베딩으로 변환하는 벡터 임베딩.

  1. 벡터화: 최첨단 머신러닝 모델과 같은 ML 모델 YOLO11와 같은 ML 모델은 이미지나 텍스트를 처리하여 벡터, 즉 항목의 특징(예: 모양, 색상 또는 의미론적 개념)을 나타내는 긴 숫자 목록)을 출력합니다.
  2. 인덱싱: 이러한 벡터는 전용 벡터 데이터베이스 내에서 효율적으로 정리되어 있으며 벡터 데이터베이스에 효율적으로 정리되어 빠르게 검색할 수 있습니다.
  3. 유사도 계산: 사용자가 쿼리를 제출하면 시스템은 쿼리를 벡터로 변환하고 로 변환하고 다음과 같은 메트릭을 사용하여 저장된 벡터와의 거리를 측정합니다. 코사인 유사도 또는 유클리드 거리.
  4. 검색: 시스템은 '가장 가까운 이웃', 즉 쿼리와 수학적으로 가장 가까운 벡터를 식별하여 반환합니다. 쿼리와 수학적으로 가장 가까운 벡터를 식별하여 반환합니다. 근사 최인접 이웃(ANN) 알고리즘을 활용하여 대규모 데이터 세트에서 확장성을 높입니다.

실제 애플리케이션

벡터 검색은 사용자가 매일 상호 작용하는 다양한 지능형 기능을 구동하며, 다음과 같은 다양한 산업에 걸쳐 있습니다. 다양한 산업에 걸쳐 사용자가 매일 상호작용하는 많은 지능형 기능을 구동합니다.

  • 소매업의 시각적 발견: In 리테일 분야의 AI, 벡터 검색은 '쇼핑하기' 기능을 강화합니다. 보기" 기능을 지원합니다. 사용자가 운동화 사진을 업로드하면 시스템은 컴퓨터 비전을 사용하여 컴퓨터 비전을 사용하여 임베딩을 생성하고 카탈로그에서 시각적으로 유사한 제품을 찾아내어 스타일이 아닌 스타일에 기반한 추천 시스템 추천 시스템으로 효과적으로 작동합니다.
  • 콘텐츠 검토 및 보안: 플랫폼은 벡터 검색을 사용하여 새로운 업로드를 알려진 불법 콘텐츠 및 보안 위협 데이터베이스와 비교하여 알려진 불법 콘텐츠 또는 보안 위협의 데이터베이스와 비교하여 이상 징후를 탐지합니다. 이미지 또는 동영상 프레임의 의미론적 특징을 일치시킴으로써 이미지 또는 동영상 프레임의 의미론적 특징을 일치시킴으로써, 시스템은 약간 변경된 경우에도 잠재적으로 유해한 콘텐츠에 플래그를 지정하여 데이터 보안을 강화합니다.

Python 예제: 임베딩 생성하기

벡터 검색 파이프라인의 첫 번째 단계는 임베딩을 생성하는 것입니다. 다음 코드 스니펫은 를 사용하여 이미지에서 특징 벡터를 생성하는 방법을 보여줍니다. Ultralytics Python 패키지와 사전 학습된 모델을 사용하여 이미지에서 특징 벡터를 생성하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load the official YOLO11 model
model = YOLO("yolo11n.pt")

# Generate embeddings for an image file or URL
# The 'embed' method returns the high-dimensional feature vector
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

벡터 검색 vs. 관련 개념

이러한 시스템을 효과적으로 구현하려면 벡터 검색을 데이터 과학 환경에서 밀접하게 관련된 용어와 구별하는 것이 도움이 됩니다. 데이터 과학 환경과 구별하는 것이 도움이 됩니다.

  • 벡터 검색과 시맨틱 검색 비교: 시맨틱 검색은 사용자의 의도와 의미를 이해하는 더 넓은 개념입니다. 벡터 검색은 벡터의 수학적 근접성을 계산하여 벡터의 수학적 근접성을 계산하여 이를 달성하는 데 사용되는 방법입니다. 시맨틱 검색 가 '무엇'(의미 찾기)을 설명하는 반면, 벡터 검색은 '어떻게'(임베딩 사용 및 거리 메트릭 사용)를 설명합니다.
  • 벡터 검색과 벡터 데이터베이스 비교: 벡터 데이터베이스는 임베딩을 저장하고 색인을 생성하는 데 사용되는 특수한 인프라입니다. 벡터 검색은 유사한 항목을 찾기 위해 해당 데이터베이스를 쿼리하는 작업 또는 프로세스입니다. 벡터 데이터베이스를 활용하면 벡터 검색을 효율적으로 수행합니다.
  • 벡터 검색 대 자연어 처리(NLP): NLP는 컴퓨터와 인간 언어 간의 상호 작용에 중점을 둡니다. 트랜스포머와 같은 NLP 모델은 텍스트 임베딩을 생성하는 데 자주 사용되는 반면, 벡터 검색은 이러한 임베딩에 따라 작동하는 검색 메커니즘입니다. 임베딩.

실시간 추론의 속도와 실시간 추론 속도와 심층 벡터 검색을 통해 애플리케이션은 딱딱한 데이터베이스를 넘어 직관적인 직관적인 검색 경험을 제공할 수 있습니다. 인벤토리를 위한 인벤토리를 위한 객체 감지 또는 챗봇을 구축하든, 벡터 검색은 현대 AI 개발의 최신 AI 개발자 툴킷의 기본 도구입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기