Yolo 비전 선전
선전
지금 참여하기
용어집

질의 응답

Explore how Question Answering (QA) uses AI to provide factual answers. Learn about VQA with [YOLO26](https://docs.ultralytics.com/models/yolo26/) and NLP techniques.

Question Answering (QA) is a specialized field within artificial intelligence (AI) and natural language processing (NLP) focused on building systems that automatically answer questions posed by humans in natural language. Unlike traditional search engines that retrieve a list of relevant documents or web pages, a QA system attempts to understand the intent of the user's query and provide a precise, factual answer. This capability bridges the gap between massive, unstructured data repositories and the specific information needs of users, making it a critical component of modern AI Agents and virtual assistants.

질의 응답 작동 방식

At its core, a Question Answering system involves three main stages: question processing, document retrieval, and answer extraction. First, the system analyzes the input query to determine what is being asked (e.g., a "who," "where," or "how" question) and identifies key entities. Next, it searches through a knowledge base—which could be a closed set of manuals or the open internet—to find passages relevant to the query. Finally, it uses advanced techniques like machine reading comprehension to pinpoint the exact answer within the text or generate a response based on the synthesized information.

Modern QA systems often leverage Large Language Models (LLMs) and transformers like BERT (Bidirectional Encoder Representations from Transformers) to achieve high accuracy. These models are pre-trained on vast amounts of text, allowing them to grasp context, nuance, and semantic relationships better than keyword-based methods.

질의 응답 시스템의 유형

QA 시스템은 일반적으로 접근하는 데이터의 도메인과 지원하는 모달리티에 따라 분류됩니다.

  • 개방형 질의응답(Open-Domain QA): 이러한 시스템은 일반적으로 방대한 데이터셋이나 공개 인터넷에 접근하여 거의 모든 주제에 대한 질문에 답합니다. 예를 들어 아마존 알렉사(Amazon Alexa )나 애플 시리(Apple Siri) 같은 음성 비서에게 제기되는 일반적인 질의가 이에 해당합니다.
  • 폐쇄형 도메인 QA: 법률 문서나 의료 기록과 같은 특정 주제에 국한됩니다. 범위를 제한함으로써 이러한 시스템은 종종 더 높은 정확도를 달성하고 대규모 언어 모델( LLM)의 환각 현상 위험을 줄입니다.
  • 시각적 질문 답변(VQA): 이 고급 변형은 시스템이 이미지를 기반으로 질문에 답변하도록 요구합니다(예: "차량 색상은 무엇입니까?"). VQA는 텍스트 처리와 컴퓨터 비전(CV) 을 결합하여 동시에 "보고" "읽는" 다중 모달 AI를 필요로 합니다.

실제 애플리케이션

QA 기술의 도입은 산업계가 방대한 양의 비정형 데이터와 상호작용하는 방식을 변화시키고 있다.

  1. 의료 및 임상 지원: 의료 분야 인공지능 영역에서 QA 시스템은 PubMed 같은 저장소에서 약물 상호작용, 증상 또는 치료 프로토콜을 신속하게 찾아내 의료 전문가를 지원합니다. 앨런 인공지능 연구소 같은 기관들은 향상된 QA를 통해 과학적 발견을 가속화하기 위해 의미론적 학자들을 적극적으로 개발 중입니다.
  2. Enterprise Knowledge Management: Large corporations use internal bots equipped with QA capabilities to help employees instantly find internal policy information or technical documentation, significantly improving productivity compared to manual searching.
  3. 자동화된 고객 지원: 소매업에 인공지능( AI)을 통합함으로써 기업들은 주문 상태나 반품 정책에 관한 특정 사용자 문의를 해결하기 위해 QA 봇을 배치하여, 사람의 개입 없이 연중무휴 지원을 제공합니다.

시각적 구성 요소: 시각과 텍스트의 가교 역할

시각적 질문응답(VQA)을 위해 시스템은 먼저 장면 내 객체와 그 관계를 식별해야 합니다. 고성능 객체 탐지 모델은 QA 시스템의 '눈' 역할을 합니다. 최신 Ultralytics 모델은 이 작업에 이상적이며, 장면 요소를 신속하고 정확하게 탐지하여 추론을 위한 언어 모델에 입력할 수 있습니다.

The following Python example demonstrates how to use the Ultralytics YOLO26 model to extract visual context (objects) from an image, which is the foundational step in a VQA pipeline:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (latest generation)
model = YOLO("yolo26n.pt")

# Perform inference to identify objects in the image
# This provides the "visual facts" for a QA system
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects and their labels
results[0].show()

관련 개념

기계 학습 분야에서 질문 답변(Question Answering)을 유사한 용어들과 구분하는 것이 유용합니다:

  • QA 대 시맨틱 검색: 시맨틱 검색은 의미를 기반으로 가장 관련성 높은 문서나 문단을 검색합니다. QA는 한 단계 더 나아가 해당 문서 내에 포함된 구체적인 답변을 추출하거나 생성합니다.
  • QA 대 챗봇: 챗봇은 대화형 인터페이스입니다. 많은 챗봇이 기능을 수행하기 위해 QA를 사용하지만, 챗봇은 대화 흐름(인사, 후속 질문)을 처리하는 반면, QA 구성 요소는 사실 검색을 담당합니다.
  • QA vs. Text Generation: Text generation focuses on creating new content (stories, emails). QA is focused on factual accuracy and retrieval, though generative models like Retrieval Augmented Generation (RAG) are often used to format the final answer.

The evolution of QA is heavily supported by open-source frameworks like PyTorch and TensorFlow, enabling developers to build increasingly sophisticated systems that understand the world through both text and pixels. For those looking to manage datasets for training these systems, the Ultralytics Platform offers comprehensive tools for annotation and model management.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기