Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Kỹ thuật Prompt

Nắm vững nghệ thuật kỹ thuật prompt để hướng dẫn các mô hình AI như LLM cho ra các kết quả chính xác, chất lượng cao trong nội dung, dịch vụ khách hàng và hơn thế nữa.

Kỹ thuật nhắc nhở là quy trình chiến lược về cấu trúc và tối ưu hóa văn bản đầu vào, được gọi là lời nhắc, để hướng dẫn hiệu quả các mô hình Trí tuệ Nhân tạo (AI) tạo ra các đầu ra cụ thể, chất lượng cao. Mặc dù ban đầu được phổ biến nhờ sự ra đời của các Mô hình Ngôn ngữ Lớn (LLM) như GPT-4 , nhưng lĩnh vực này đã phát triển thành một kỹ năng quan trọng để tương tác với các hệ thống tạo sinh khác nhau. Nó bao gồm việc hiểu các sắc thái trong cách một mô hình diễn giải ngôn ngữ, ngữ cảnh và hướng dẫn để thu hẹp khoảng cách giữa ý định của con người và khả năng thực thi của máy. Bằng cách lựa chọn từ ngữ cẩn thận, các ràng buộc định dạng và cung cấp ngữ cảnh, người dùng có thể cải thiện đáng kể độ chính xác và tính phù hợp của các phản hồi AI tạo sinh mà không cần phải thay đổi các tham số cơ bản của mô hình.

Cơ chế của lời nhắc hiệu quả

Về cốt lõi, kỹ thuật lập trình nhanh dựa trên nguyên tắc rằng các mô hình AI nhạy cảm với cách diễn đạt và cấu trúc của dữ liệu đầu vào. Một lời nhắc được thiết kế tốt thường chứa các thành phần cụ thể được thiết kế để giảm thiểu sự mơ hồ. Chúng bao gồm các hướng dẫn rõ ràng, thông tin nền liên quan (bối cảnh) và các thông số kỹ thuật đầu ra như định dạng—ví dụ: yêu cầu phản hồi bằng JSON hoặc danh sách gạch đầu dòng. Các kỹ thuật tiên tiến bao gồm học ít lần , trong đó người dùng cung cấp các ví dụ về các cặp đầu vào-đầu ra mong muốn trong lời nhắc để hướng dẫn suy luận của mô hình. Một phương pháp mạnh mẽ khác là gợi ý chuỗi suy nghĩ , khuyến khích mô hình chia nhỏ các vấn đề phức tạp thành các bước suy luận trung gian, cải thiện hiệu suất cho các tác vụ nặng về logic như được trình bày chi tiết trong các ấn phẩm của Google Research .

Mức độ Liên quan trong Thị giác Máy tính

Mặc dù thường được liên kết với việc tạo văn bản, kỹ thuật nhắc nhở ngày càng trở nên quan trọng trong Thị giác Máy tính (CV) . Các mô hình đa phương thức hiện đại và các bộ phát hiện từ vựng mở, chẳng hạn như YOLO -World , cho phép người dùng xác định mục tiêu phát hiện bằng ngôn ngữ tự nhiên thay vì ID lớp được xác định trước. Trong bối cảnh này, "nhắc nhở" là mô tả văn bản của đối tượng (ví dụ: "mũ bảo hiểm đỏ" so với "mũ bảo hiểm"). Khả năng này, thường được gọi là học không cần bắn , cho phép các mô hình detect các đối tượng mà chúng không được đào tạo rõ ràng, chỉ bằng cách xử lý mối quan hệ ngữ nghĩa giữa lời nhắc văn bản và các đặc điểm trực quan.

Ví dụ sau đây minh họa cách áp dụng kỹ thuật nhanh chóng theo chương trình bằng cách sử dụng ultralytics gói để định nghĩa động các lớp cho phát hiện đối tượng:

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")

# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])

# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")

Các Ứng dụng Thực tế

Tiện ích của kỹ thuật nhanh chóng trải rộng trên nhiều ngành công nghiệp khác nhau, nâng cao khả năng tự động hóa và sáng tạo:

  • Tạo Nội dung Tự động: Trong tiếp thị và truyền thông, các chuyên gia sử dụng lời nhắc chi tiết để hướng dẫn các công cụ chuyển văn bản thành hình ảnh như Midjourney hoặc Stable Diffusion . Một lời nhắc cụ thể mô tả ánh sáng, phong cách nghệ thuật và bố cục cho phép các nhà thiết kế nhanh chóng tạo nguyên mẫu cho các tài sản hình ảnh, tiết kiệm thời gian so với các phương pháp kết xuất truyền thống.
  • Hỗ trợ Khách hàng Thông minh: Các công ty triển khai chatbot được hỗ trợ bởi LLM để xử lý các yêu cầu của khách hàng. Các kỹ sư tạo ra "lời nhắc hệ thống" để xác định tính cách của bot (ví dụ: "Bạn là một trợ lý hỗ trợ kỹ thuật hữu ích"), đặt ra các giới hạn để ngăn ngừa ảo giác và hướng dẫn AI tìm kiếm câu trả lời từ một cơ sở kiến thức cụ thể.

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt kỹ thuật nhanh chóng với các thuật ngữ tương tự trong bối cảnh học máy:

  • Kỹ thuật Prompt so với Điều chỉnh Prompt : Kỹ thuật Prompt liên quan đến việc tạo thủ công các truy vấn ngôn ngữ tự nhiên. Ngược lại, điều chỉnh prompt là một cơ chế hiệu quả về tham số, học các nhúng mềm (vectơ số) trong giai đoạn huấn luyện để tối ưu hóa đầu vào mô hình, thường vô hình đối với người dùng.
  • Kỹ thuật nhanh so với tinh chỉnh : Tinh chỉnh cập nhật vĩnh viễn trọng số mô hình bằng cách huấn luyện trên một tập dữ liệu chuyên biệt. Kỹ thuật nhanh không thay đổi bản thân mô hình; nó chỉ tối ưu hóa đầu vào trong quá trình suy luận thời gian thực .
  • Kỹ thuật Nhanh so với Kỹ thuật Tăng cường Truy xuất (RAG): Kỹ thuật Nhanh là một kiến trúc hệ thống lấy dữ liệu bên ngoài để làm cơ sở cho phản hồi của mô hình. Kỹ thuật Nhanh là kỹ thuật được sử dụng trong RAG để định dạng chính xác dữ liệu đã truy xuất và trình bày cho LLM để xử lý.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay