Context Engineering
Khám phá cách kỹ thuật ngữ cảnh (context engineering) cấu trúc các payload dữ liệu cho AI. Tìm hiểu các chiến lược then chốt để tối ưu hóa LLM và quy trình làm việc thị giác máy tính với Ultralytics YOLO26.
Kỹ thuật ngữ cảnh là nghệ thuật và khoa học trong việc chọn lọc, quản lý và cấu trúc thông tin được cung cấp cho các mô hình trí tuệ nhân tạo trong quá trình suy luận. Trong khi Prompt Engineering tập trung chủ yếu vào việc viết các chỉ dẫn hiệu quả, kỹ thuật ngữ cảnh tiến thêm một bước bằng cách tối ưu hóa một cách hệ thống payload của các token—như dữ liệu trực tiếp, tri thức bên ngoài và phản hồi từ công cụ—nhằm lấp đầy context window của mô hình. Mục tiêu là đảm bảo một Large Language Model (LLM) hoặc một Vision-Language Model (VLM) nhận được nền tảng chính xác cần thiết để suy luận một cách chuẩn xác mà không bị quá tải thông tin.
Như được nêu trong một bản khảo sát toàn diện về kỹ thuật ngữ cảnh cho LLM gần đây, lĩnh vực này liên quan đến việc chính thức hóa quá trình truy xuất, xử lý và quản lý thông tin. Nó về cơ bản đóng vai trò như pipeline bộ nhớ và trí tuệ cho các ứng dụng AI hiện đại.
Link to this sectionTinh chỉnh ngữ cảnh kinh doanh AI#
Đối với các doanh nghiệp, các mô hình AI tổng quát thường bị hạn chế do không tiếp cận được dữ liệu độc quyền. Kỹ thuật ngữ cảnh hỗ trợ quá trình tinh chỉnh ngữ cảnh kinh doanh AI, nghĩa là các đầu ra của mô hình được tùy chỉnh cụ thể cho các quy trình công việc và luồng dữ liệu trực tiếp của tổ chức. Bằng cách tích hợp Retrieval-Augmented Generation (RAG), các công ty có thể trích xuất ngữ cảnh của ngữ cảnh một cách liền mạch—từ wiki nội bộ, hệ thống quản lý quan hệ khách hàng, hoặc các API thời gian thực—trực tiếp vào pipeline xử lý của mô hình.
Một trong những đột phá quan trọng nhất trong lĩnh vực này là Model Context Protocol (MCP), một tiêu chuẩn mở mới được Anthropic giới thiệu và được Linux Foundation lưu trữ. MCP giải quyết vấn đề tích hợp dữ liệu quy mô lớn bằng cách cung cấp một bộ kết nối phổ quát cho các trợ lý AI, cho phép các lập trình viên chuẩn hóa cách họ đưa tri thức tổ chức có ngữ cảnh vào các Agentic Workflows mà không cần phải xây dựng các pipeline tùy chỉnh cho mỗi nguồn dữ liệu mới.
Link to this sectionChiến lược: Bộ nhớ ngữ cảnh vai trò và Tối ưu hóa#
Kỹ thuật ngữ cảnh hiệu quả dựa trên việc quản lý bộ nhớ chiến lược để ngăn chặn mô hình quên các chỉ dẫn quan trọng hoặc tạo ra thông tin sai lệch (hallucination). Bằng cách tận dụng đúng các kỹ thuật này, các lập trình viên có thể chuyển đổi từ các truy vấn chat dùng một lần sang các hệ thống tự hành có độ tin cậy cao, có khả năng thực thi các quy trình doanh nghiệp đa bước:
- Write Context: Đưa dữ liệu cụ thể, có giá trị cao trực tiếp vào system prompt để hướng dẫn hành vi ngay lập tức.
- Select Context: Truy xuất động chỉ những đoạn trích dẫn phù hợp nhất từ cơ sở dữ liệu vector để cung cấp tri thức tổ chức theo thời gian thực.
- Compress Context: Tóm tắt các tài liệu dài để phù hợp với giới hạn bộ nhớ của các mô hình dung lượng lớn như GPT-4o hoặc Google Gemini.
- Isolate Context: Phân chia các tác vụ giữa nhiều sub-agent để mỗi agent chỉ nhận được nền tảng cần thiết cho vai trò cụ thể của nó, thường được gọi là quản lý bộ nhớ ngữ cảnh vai trò.
Link to this sectionCác ứng dụng AI trong thực tế#
Kỹ thuật ngữ cảnh đang tích cực biến đổi cả các giải pháp AI dựa trên văn bản và dựa trên thị giác trên nhiều ngành công nghiệp:
- Enterprise Multi-Tool Agents: Một trợ lý công ty nội bộ sử dụng kỹ thuật ngữ cảnh để hỗ trợ các đội ngũ bán hàng. Thay vì người dùng phải sao chép thông tin qua lại, AI truy xuất dữ liệu khách hàng trực tiếp một cách an toàn từ CRM thông qua MCP. Sau đó, nó tóm tắt các liên lạc gần đây và soạn thảo một email theo dõi có mục tiêu, giúp tối ưu hóa đáng kể các hoạt động hàng ngày.
- Context-Aware Medical Imaging: Trong chăm sóc sức khỏe, dữ liệu hình ảnh đơn thuần hiếm khi là đủ. Một pipeline computer vision có thể sử dụng Ultralytics YOLO26 để phát hiện các bất thường trong ảnh X-quang. Kỹ thuật ngữ cảnh kết hợp các BBox thị giác này với hồ sơ sức khỏe điện tử của bệnh nhân (tuổi, bệnh lý nền, thuốc đang sử dụng) trước khi gửi payload thống nhất đến một mô hình deep learning để đưa ra suy luận chẩn đoán toàn diện.
Link to this sectionKỹ thuật ngữ cảnh trong Computer Vision#
Mặc dù thường gắn liền với các mô hình ngôn ngữ, kỹ thuật ngữ cảnh đang trở nên cần thiết để triển khai các hệ thống object detection mạnh mẽ. Khi tích hợp các mô hình như YOLO26 được xây dựng với PyTorch hoặc TensorFlow, các lập trình viên có thể sử dụng ngữ cảnh để làm phong phú các dự đoán của họ cho các phân tích hạ nguồn.
Ví dụ Python dưới đây minh họa cách trích xuất một suy luận predict sử dụng gói ultralytics và định dạng nó cùng với metadata bên ngoài để tạo ra một payload ngữ cảnh được làm phong phú:
import json
from ultralytics import YOLO
# Load the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Execute inference on an image
results = model("patient_scan.jpg")
# Extract human-readable class names from the detected bounding boxes
detected_objects = [model.names[int(box.cls[0])] for box in results[0].boxes]
# Apply context engineering: merge visual AI outputs with external metadata
enriched_context = {
"patient_id": "PX-8923",
"clinical_history": "Chronic cough, non-smoker",
"yolo_visual_findings": detected_objects,
"scan_timestamp": "2026-06-25T09:03:00Z",
}
# Output the structured context, ready to be ingested by an MCP server or LLM
print(json.dumps(enriched_context, indent=4))Để xây dựng, gắn nhãn và quản lý các tập dữ liệu cho những pipeline thị giác phức tạp này một cách dễ dàng, các đội ngũ có thể tận dụng Ultralytics Platform. Đối với các tổ chức triển khai các giải pháp này một cách thương mại trong môi trường riêng tư, một Enterprise license đảm bảo việc tích hợp an toàn và tuân thủ các kiến trúc kỹ thuật ngữ cảnh tiên tiến.






