Yolo 비전 선전
선전
지금 참여하기
용어집

질의 응답

인공지능(AI)과 자연어 처리(NLP) 분야의 질문응답(QA) 기술을 탐구해 보세요. 시스템이 데이터에서 사실 기반 답변을 추출하는 방식을 배우고, Ultralytics 시각적 QA 작업을 어떻게 지원하는지 알아보세요.

질문응답(QA)은 인공 지능(AI) 및 자연어 처리(NLP) 분야의 전문 분야로, 인간이 자연어로 제기한 질문에 자동으로 답변하는 시스템 구축에 중점을 둡니다. 관련 문서나 웹 페이지 목록을 검색해 제공하는 기존 검색 엔진과 달리, QA 시스템은 사용자의 질의 의도를 이해하고 정확하며 사실에 기반한 답변을 제공하려 합니다. 이러한 능력은 방대한 비정형 데이터 저장소와 사용자의 구체적인 정보 요구 사이의 간극을 메워주며, 현대 AI 에이전트와 가상 비서의 핵심 구성 요소로 자리매김하고 있습니다.

질의 응답 작동 방식

질문응답 시스템의 핵심은 크게 세 단계로 이루어집니다: 질문 처리, 문서 검색, 답변 추출입니다. 먼저 시스템은 입력된 질의를 분석하여 질문의 유형(예: "누가", "어디서", "어떻게" 질문)을 파악하고 핵심 개체를 식별합니다. 다음으로, 폐쇄형 매뉴얼 집합이나 공개 인터넷과 같은 지식 기반을 검색하여 쿼리와 관련된 문단을 찾습니다. 마지막으로, 기계 독해 이해와 같은 고급 기법을 사용하여 텍스트 내에서 정확한 답변을 찾아내거나 종합된 정보를 바탕으로 응답을 생성합니다.

현대적인 QA 시스템은 높은 정확도를 달성하기 위해 대규모 언어 모델(LLM)BERT(Bidirectional Encoder Representations from Transformers)와 같은 트랜스포머를 활용하는 경우가 많습니다. 이러한 모델들은 방대한 양의 텍스트로 사전 훈련되어 키워드 기반 방법보다 문맥, 미묘한 차이, 의미적 관계를 더 잘 파악할 수 있습니다.

질의 응답 시스템의 유형

QA 시스템은 일반적으로 접근하는 데이터의 도메인과 지원하는 모달리티에 따라 분류됩니다.

  • 개방형 질의응답(Open-Domain QA): 이러한 시스템은 일반적으로 방대한 데이터셋이나 공개 인터넷에 접근하여 거의 모든 주제에 대한 질문에 답합니다. 예를 들어 아마존 알렉사(Amazon Alexa )나 애플 시리(Apple Siri) 같은 음성 비서에게 제기되는 일반적인 질의가 이에 해당합니다.
  • 폐쇄형 도메인 QA: 법률 문서나 의료 기록과 같은 특정 주제에 국한됩니다. 범위를 제한함으로써 이러한 시스템은 종종 더 높은 정확도를 달성하고 대규모 언어 모델( LLM)의 환각 현상 위험을 줄입니다.
  • 시각적 질문 답변(VQA): 이 고급 변형은 시스템이 이미지를 기반으로 질문에 답변하도록 요구합니다(예: "차량 색상은 무엇입니까?"). VQA는 텍스트 처리와 컴퓨터 비전(CV) 을 결합하여 동시에 "보고" "읽는" 다중 모달 AI를 필요로 합니다.

실제 애플리케이션

QA 기술의 도입은 산업계가 방대한 양의 비정형 데이터와 상호작용하는 방식을 변화시키고 있다.

  1. 의료 및 임상 지원: 의료 분야 인공지능 영역에서 QA 시스템은 PubMed 같은 저장소에서 약물 상호작용, 증상 또는 치료 프로토콜을 신속하게 찾아내 의료 전문가를 지원합니다. 앨런 인공지능 연구소 같은 기관들은 향상된 QA를 통해 과학적 발견을 가속화하기 위해 의미론적 학자들을 적극적으로 개발 중입니다.
  2. 기업 지식 관리: 대기업들은 QA 기능을 갖춘 내부 봇을 활용하여 직원들이 내부 정책 정보나 기술 문서를 즉시 찾을 수 있도록 지원함으로써 수동 검색에 비해 생산성을 크게 향상시킵니다.
  3. 자동화된 고객 지원: 소매업에 인공지능( AI)을 통합함으로써 기업들은 주문 상태나 반품 정책에 관한 특정 사용자 문의를 해결하기 위해 QA 봇을 배치하여, 사람의 개입 없이 연중무휴 지원을 제공합니다.

시각적 구성 요소: 시각과 텍스트의 가교 역할

시각적 질문응답(VQA)을 위해 시스템은 먼저 장면 내 객체와 그 관계를 식별해야 합니다. 고성능 객체 탐지 모델은 QA 시스템의 '눈' 역할을 합니다. 최신 Ultralytics 모델은 이 작업에 이상적이며, 장면 요소를 신속하고 정확하게 탐지하여 추론을 위한 언어 모델에 입력할 수 있습니다.

다음 Python Ultralytics 모델을 사용하여 이미지에서 시각적 컨텍스트(객체)를 추출하는 방법을 보여줍니다. 이는 VQA 파이프라인의 기초 단계입니다:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (latest generation)
model = YOLO("yolo26n.pt")

# Perform inference to identify objects in the image
# This provides the "visual facts" for a QA system
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects and their labels
results[0].show()

관련 개념

기계 학습 분야에서 질문 답변(Question Answering)을 유사한 용어들과 구분하는 것이 유용합니다:

  • QA 대 시맨틱 검색: 시맨틱 검색은 의미를 기반으로 가장 관련성 높은 문서나 문단을 검색합니다. QA는 한 단계 더 나아가 해당 문서 내에 포함된 구체적인 답변을 추출하거나 생성합니다.
  • QA 대 챗봇: 챗봇은 대화형 인터페이스입니다. 많은 챗봇이 기능을 수행하기 위해 QA를 사용하지만, 챗봇은 대화 흐름(인사, 후속 질문)을 처리하는 반면, QA 구성 요소는 사실 검색을 담당합니다.
  • QA 대 텍스트 생성: 텍스트 생성은 새로운 콘텐츠(스토리, 이메일)를 만드는 데 중점을 둡니다. QA는 사실적 정확성과 검색에 초점을 맞추지만, 최종 답변을 형식화하기 위해 검색 강화 생성(RAG)과 같은 생성 모델이 종종 사용됩니다.

QA의 진화는 다음과 같은 오픈소스 프레임워크에 의해 크게 지원됩니다. PyTorchTensorFlow와 같은 오픈소스 프레임워크에 크게 의존하고 있으며, 이를 통해 개발자들은 텍스트와 픽셀을 통해 세상을 이해하는 점점 더 정교한 시스템을 구축할 수 있습니다. 이러한 시스템을 훈련시키기 위한 데이터셋 관리를 원하는 분들을 위해 Ultralytics 주석 작업 및 모델 관리를 위한 포괄적인 도구를 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기