Làm chủ AI với sự làm giàu nhanh chóng! Nâng cao kết quả của Mô hình ngôn ngữ lớn bằng cách sử dụng ngữ cảnh, hướng dẫn rõ ràng và ví dụ để có kết quả chính xác.
Làm giàu nhanh là quá trình tự động hoặc bán tự động tăng cường lời nhắc đầu vào ban đầu của người dùng trước khi nó được xử lý bởi mô hình Trí tuệ nhân tạo (AI) , đặc biệt là Mô hình ngôn ngữ lớn (LLM) . Mục tiêu chính là cải thiện chất lượng, tính liên quan và tính đặc thù của đầu ra của AI bằng cách thêm thông tin ngữ cảnh có liên quan, làm rõ những điểm mơ hồ tiềm ẩn, đặt ra các ràng buộc hoặc bao gồm các chi tiết cụ thể. Kỹ thuật này tinh chỉnh sự tương tác giữa người dùng và hệ thống AI, giúp lời nhắc hiệu quả hơn mà không cần người dùng phải có chuyên môn sâu về kỹ thuật lời nhắc , do đó cải thiện trải nghiệm người dùng (UX) tổng thể.
Quá trình làm giàu thường bắt đầu bằng cách phân tích lời nhắc gốc của người dùng. Dựa trên phân tích này, hệ thống tận dụng các nguồn thông tin bổ sung hoặc các quy tắc được xác định trước để tăng cường lời nhắc. Điều này có thể bao gồm việc truy cập lịch sử tương tác của người dùng, truy xuất các tài liệu có liên quan từ cơ sở kiến thức , kết hợp ngữ cảnh của cuộc trò chuyện đang diễn ra hoặc áp dụng các hướng dẫn định dạng cụ thể theo yêu cầu của mô hình. Ví dụ: một lời nhắc đơn giản như "Tóm tắt Ultralytics "developments" có thể được làm giàu để chỉ rõ "Tóm tắt các tính năng chính và cải tiến hiệu suất của Ultralytics YOLOv11 so với YOLOv8 , tập trung vào các tác vụ phát hiện đối tượng ". Các kỹ thuật như Retrieval-Augmented Generation (RAG) thường được sử dụng, trong đó hệ thống lấy các đoạn dữ liệu có liên quan (ví dụ: từ Ultralytics Docs ) và kết hợp chúng vào cửa sổ ngữ cảnh của lời nhắc trước khi gửi đến LLM. Điều này đảm bảo mô hình có đủ bối cảnh cần thiết để tạo ra phản hồi toàn diện và chính xác.
Việc làm giàu nhanh chóng có giá trị trong nhiều ứng dụng do AI điều khiển, giúp nâng cao chất lượng tương tác và hiệu suất tác vụ:
Việc hiểu được những sắc thái giữa làm giàu nhanh chóng và các thuật ngữ tương tự là rất quan trọng:
Trong khi làm giàu nhanh chóng thường được liên kết với LLM và Hiểu ngôn ngữ tự nhiên (NLU) , các nguyên tắc của nó đang trở nên phù hợp trong Thị giác máy tính (CV) . Các tác vụ CV truyền thống như phát hiện đối tượng tiêu chuẩn bằng các mô hình như Ultralytics YOLO thường dựa vào đầu vào hình ảnh thay vì các lời nhắc văn bản phức tạp. Tuy nhiên, các mô hình đa phương thức mới hơn và các hệ thống thị giác có thể nhắc nhở, chẳng hạn như CLIP , YOLO -World và YOLOE , chấp nhận lời nhắc văn bản hoặc hình ảnh để hướng dẫn các tác vụ như phát hiện không có phát súng nào . Đối với các mô hình này, việc làm giàu lời nhắc văn bản đơn giản (ví dụ: "phát hiện phương tiện") với nhiều ngữ cảnh hơn (ví dụ: "chỉ phát hiện phương tiện khẩn cấp như xe cứu thương và xe cứu hỏa trong nguồn cấp dữ liệu camera giao thông này") có thể cải thiện đáng kể hiệu suất và tính đặc hiệu. Các nền tảng như Ultralytics HUB có khả năng tích hợp các kỹ thuật như vậy để đơn giản hóa tương tác của người dùng khi xác định các tác vụ thị giác phức tạp hoặc phân tích kết quả, đại diện cho một lĩnh vực nghiên cứu và phát triển AI đang diễn ra nhằm cải thiện tính an toàn và khả năng sử dụng AI trên nhiều miền.