Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

GPT (Generative Pre-trained Transformer)

Khám phá các nguyên tắc cơ bản của GPT (Generative Pre-trained Transformer). Tìm hiểu cách các model này hoạt động và cách tích hợp chúng với Ultralytics YOLO26 cho thị giác máy tính.

GPT (Generative Pre-trained Transformer) đề cập đến một dòng các mô hình neural network được thiết kế để tạo văn bản giống con người và giải quyết các tác vụ phức tạp bằng cách dự đoán phần tử tiếp theo trong một chuỗi. Các mô hình này được xây dựng dựa trên kiến trúc Transformer, cụ thể là sử dụng các khối decoder cho phép chúng xử lý dữ liệu song song thay vì tuần tự. Khía cạnh "Pre-trained" (được huấn luyện trước) chỉ ra rằng mô hình trải qua giai đoạn đầu là unsupervised learning trên các tập dữ liệu khổng lồ—bao gồm sách, bài báo và trang web—để học cấu trúc thống kê của ngôn ngữ. "Generative" (tạo sinh) biểu thị khả năng chính của mô hình: tạo nội dung mới thay vì chỉ đơn thuần phân loại các đầu vào hiện có.

Link to this sectionKiến trúc cốt lõi và chức năng#

Tại trung tâm của một mô hình GPT là attention mechanism, một kỹ thuật toán học cho phép mạng lưới cân nhắc tầm quan trọng của các từ khác nhau trong một câu so với nhau. Cơ chế này giúp mô hình hiểu được ngữ cảnh, sắc thái và các phụ thuộc tầm xa, chẳng hạn như nhận biết rằng một đại từ ở cuối đoạn văn tham chiếu đến một danh từ được đề cập ở đầu.

Sau khi pre-training ban đầu, các mô hình này thường trải qua quá trình fine-tuning để chuyên biệt hóa cho các tác vụ cụ thể hoặc căn chỉnh chúng với các giá trị của con người. Các kỹ thuật như Reinforcement Learning from Human Feedback (RLHF) thường được sử dụng để đảm bảo mô hình tạo ra các phản hồi an toàn, hữu ích và chính xác. Quy trình hai bước này—pre-training tổng quát theo sau bởi fine-tuning cụ thể—là điều làm cho các mô hình GPT trở thành những foundation models linh hoạt.

Link to this sectionCác ứng dụng trong thực tế#

Các mô hình GPT đã vượt ra ngoài nghiên cứu lý thuyết để trở thành các công cụ thực tế, hàng ngày trên nhiều ngành công nghiệp.

  • Trợ lý lập trình thông minh: Các lập trình viên sử dụng những công cụ được hỗ trợ bởi công nghệ GPT để viết, gỡ lỗi và lập tài liệu cho phần mềm. Các AI agents này phân tích ngữ cảnh của một kho lưu trữ mã để gợi ý toàn bộ các hàm hoặc xác định lỗi, giúp tăng tốc đáng kể vòng đời phát triển.
  • Tự động hóa dịch vụ khách hàng: Các chatbots hiện đại tận dụng GPT để xử lý các yêu cầu phức tạp của khách hàng. Không giống như các hệ thống dựa trên quy tắc cũ, những virtual assistants này có thể hiểu ý định, duy trì lịch sử hội thoại và tạo phản hồi cá nhân hóa theo thời gian thực.

Link to this sectionTích hợp GPT với Computer Vision#

Trong khi GPT vượt trội trong Natural Language Processing (NLP), nó thường được kết hợp với Computer Vision (CV) để tạo ra các hệ thống đa phương thức. Một quy trình làm việc phổ biến bao gồm việc sử dụng một bộ dò tốc độ cao như Ultralytics YOLO26 để xác định các đối tượng trong một hình ảnh, sau đó đưa dữ liệu đầu ra có cấu trúc đó vào một mô hình GPT để tạo ra một đoạn mô tả.

Ví dụ sau đây minh họa cách trích xuất tên đối tượng bằng YOLO26 để tạo một chuỗi ngữ cảnh cho một prompt GPT:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected class names to construct a text description
class_names = [model.names[int(cls)] for cls in results[0].boxes.cls]

# This string serves as the context for a GPT prompt
print(f"Detected objects for GPT context: {', '.join(class_names)}")

Link to this sectionCác khái niệm liên quan và Phân biệt#

Việc phân biệt GPT với các kiến trúc phổ biến khác rất hữu ích để hiểu vai trò cụ thể của nó.

  • GPT so với BERT: Cả hai đều sử dụng kiến trúc Transformer, nhưng chúng khác nhau về hướng tiếp cận. BERT (Bidirectional Encoder Representations from Transformers) là một mô hình chỉ dùng encoder, nhìn vào ngữ cảnh từ cả trái và phải đồng thời, làm cho nó trở nên lý tưởng cho các tác vụ như phân loại và sentiment analysis. GPT là mô hình chỉ dùng decoder, dự đoán token tiếp theo dựa trên các token trước đó, tối ưu hóa nó cho text generation.
  • GPT so với LLM: Thuật ngữ Large Language Model (LLM) là một danh mục rộng lớn cho các mô hình khổng lồ được huấn luyện trên khối lượng văn bản khổng lồ. GPT là một kiến trúc cụ thể và là một thương hiệu của LLM, đáng chú ý nhất là được phát triển bởi OpenAI.

Link to this sectionNhững thách thức và Triển vọng tương lai#

Bất chấp khả năng ấn tượng, các mô hình GPT đối mặt với những thách thức như hallucination, nơi chúng tự tin tạo ra thông tin sai lệch. Các nhà nghiên cứu đang tích cực làm việc để cải thiện AI ethics và các giao thức an toàn. Hơn nữa, việc tích hợp GPT với các công cụ như Ultralytics Platform cho phép các đường ống (pipelines) mạnh mẽ hơn, nơi các mô hình thị giác và ngôn ngữ hoạt động cùng nhau để giải quyết các vấn đề thực tế phức tạp.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning