Cách sử dụng phần Reference trong tài liệu Ultralytics YOLO
Tìm hiểu cách sử dụng phần Reference trong tài liệu Ultralytics YOLO để hiểu rõ cơ chế bên trong của gói Python Ultralytics.

Ngày nay, trí tuệ nhân tạo (AI) ngày càng trở nên dễ tiếp cận hơn bao giờ hết, cho phép bất kỳ ai cũng có thể tham gia và nhanh chóng bắt đầu sử dụng các model AI khác nhau cho nhiều tác vụ tiên tiến.
Ví dụ, computer vision là một nhánh của AI cho phép máy tính diễn giải và hiểu thông tin hình ảnh từ ảnh và video, và các model computer vision như Ultralytics YOLO11 rất dễ dàng để bắt đầu.
YOLO11 hỗ trợ các tác vụ như object detection, instance segmentation và image classification và có thể được sử dụng cho các ứng dụng như xe tự lái, giám sát an ninh và phân tích bán lẻ.

Hình 1. YOLO11 có thể được sử dụng để phát hiện nhiều vật thể khác nhau.
Cụ thể, gói Python Ultralytics cung cấp các công cụ thân thiện với người dùng để nhanh chóng train, tùy chỉnh và triển khai các model AI này, cho phép người dùng ở mọi cấp độ kỹ năng dễ dàng xây dựng các ứng dụng computer vision tiên tiến.
Tuy nhiên, nếu bạn muốn tìm hiểu sâu hơn về cách mọi thứ vận hành hoặc tạo ra các tùy chỉnh của riêng mình, phần Reference trong tài liệu Ultralytics là một tài nguyên tuyệt vời. Nó bao gồm các cơ chế bên trong của gói Python Ultralytics, bao gồm cách dữ liệu của bạn được xử lý, quy trình train model và cách bạn có thể visualize các kết quả dự đoán.
Trong bài viết này, chúng ta sẽ xem xét kỹ hơn phần Reference của tài liệu Ultralytics và cách sử dụng nó khi làm việc trên các dự án computer vision. Hãy cùng bắt đầu!
Link to this sectionCái nhìn sâu hơn về việc làm việc với các model Ultralytics YOLO#
Việc làm việc với gói Python Ultralytics rất đơn giản và trực quan. Bạn có thể train các model YOLO hoặc detect objects trong ảnh chỉ với một vài dòng code.
Tuy nhiên, khi đã quen với việc làm việc với các model computer vision, phần Reference của tài liệu Ultralytics sẽ giúp bạn hiểu sâu hơn về cách code vận hành và những hàm nào mà gói này hỗ trợ. Nó cũng bao gồm các giải thích dễ hiểu, các tùy chọn có thể cấu hình và các liên kết đến code liên quan có sẵn trên kho lưu trữ GitHub của Ultralytics.
Nó giải thích cách gói Python Ultralytics được cấu trúc và bao gồm các thành phần chính như thiết lập model, tải dữ liệu, quy trình training, và cách các dự đoán được thực hiện và trả về.
Mọi thứ được tổ chức thành các danh mục rõ ràng, giúp bạn dễ dàng tìm thấy những gì mình cần. Ví dụ: nếu bạn đang train một model với dataset của riêng mình, bạn có thể truy cập phần Reference tập trung vào dữ liệu, và nó sẽ cung cấp cho bạn ý tưởng tốt hơn về cách dữ liệu của bạn sẽ được sử dụng để train model.
Link to this sectionCách bắt đầu với phần Reference#
Nếu bạn truy cập phần Reference trong tài liệu Ultralytics YOLO, bạn sẽ thấy một menu ở bên trái trang với các danh mục tham chiếu khác nhau. Mỗi danh mục đại diện cho một phần cụ thể của codebase Ultralytics, chẳng hạn như models, xử lý dữ liệu hoặc các hàm training.
Nhấp vào một danh mục sẽ đưa bạn đến trang cung cấp thông tin chi tiết hơn.

Hình 2. Ở bên trái, bạn sẽ thấy một menu các danh mục Reference khác nhau.
Tương tự, ở phía bên phải của trang, bạn sẽ thấy mục lục chia nhỏ từng trang tham chiếu thành các thành phần chính như hàm (các khối code có thể tái sử dụng), lớp (bản thiết kế để tạo đối tượng) và phương thức (các hàm được định nghĩa bên trong lớp). Điều này giúp bạn dễ dàng truy cập ngay vào nội dung mình đang tìm kiếm.

Hình 3. Ở bên phải, bạn sẽ thấy mục lục cho trang Reference cụ thể mà bạn đang xem.
Link to this sectionCấu trúc của kho lưu trữ GitHub Ultralytics#
Kho lưu trữ GitHub Ultralytics được tổ chức thành các thư mục con hoặc gói con dựa trên các phần khác nhau của gói Ultralytics, chẳng hạn như models, training và data. Phần Reference trong tài liệu tuân theo cấu trúc này, giúp bạn dễ hiểu hơn về cách mọi thứ khớp với nhau.
Dưới đây là một số thư mục con hoặc danh mục chính bạn sẽ thấy trong cả kho lưu trữ GitHub Ultralytics và phần Reference của tài liệu Ultralytics:
- Models: Phần này tập trung vào các model khác nhau và modes của chúng, chẳng hạn như thực hiện dự đoán, kiểm tra hiệu suất và xuất các model đã train.
- Engine: Chứa logic cốt lõi để training, validation, dự đoán, xuất và đánh giá model.
- Data: Quản lý cách dataset được tải, xử lý và augment. Phần này bao gồm các hàm để tạo dataloader (công cụ cung cấp dữ liệu cho model theo lô), áp dụng các phép chuyển đổi (các thay đổi được thực hiện đối với hình ảnh như thay đổi kích thước hoặc lật để giúp model học tốt hơn) và chuẩn bị dữ liệu (tổ chức và định dạng hình ảnh và nhãn) cho quá trình training.
- Utils: Phần này cung cấp nhiều hàm trợ giúp được sử dụng trên toàn bộ codebase, chẳng hạn như công cụ trực quan hóa, xử lý tệp và tính toán metric.
- HUB: Kết nối với Ultralytics HUB, một nền tảng computer vision không cần code, kích hoạt các tính năng đám mây như đăng nhập, tải model lên và quản lý dataset thông qua API.
- Trackers: Triển khai logic theo dõi vật thể cho các ứng dụng liên quan đến video hoặc chuỗi hình ảnh theo khung hình.
Mỗi thư mục con trong kho lưu trữ GitHub đều có một phần tương ứng trong tài liệu. Cấu trúc này được cố tình phản chiếu, giúp việc chuyển đổi giữa đọc tài liệu và khám phá mã nguồn trở nên dễ dàng hơn.
Trên thực tế, trong nhiều trang Reference, mã nguồn thực tế cũng được hiển thị, vì vậy bạn có thể thấy chính xác cách các hàm và lớp được thực hiện mà không cần rời khỏi tài liệu.

Hình 4. Mã nguồn cũng được bao gồm trong các trang Reference.
Link to this sectionHiểu về các thành phần models, engine và data#
Bây giờ chúng ta đã thấy phần Reference được tổ chức như thế nào, hãy xem xét kỹ hơn ba phần chính của gói Ultralytics: models, engine và data.
Thư mục con models chứa code định nghĩa cách hoạt động của từng loại model. Nó được tổ chức theo cả loại model (như YOLO, FastSAM hoặc RT-DETR) và các tác vụ như phát hiện, phân đoạn hoặc phân loại. Bên trong mỗi mục, bạn sẽ tìm thấy các tệp hoặc module xử lý các tác vụ cụ thể - ví dụ: cách model thực hiện dự đoán, cách nó được train hoặc cách hiệu suất của nó được đánh giá.
Trong khi đó, thư mục con engine hoạt động ở hậu trường để quản lý toàn bộ quy trình. Trong khi thư mục con models tập trung vào những gì mỗi model phải làm, thư mục con engine tập trung vào cách thực hiện các tác vụ đó một cách nhất quán và hiệu quả.
Ngoài ra, thư mục con data chịu trách nhiệm tải và chuẩn bị dataset. Phần này của codebase đảm bảo rằng dữ liệu training của bạn sạch, có cấu trúc và đa dạng, giúp model học tốt hơn và tổng quát hóa hiệu quả hơn.
Sự phân tách rõ ràng này giúp code dễ bảo trì hơn và mang lại cho người dùng sự linh hoạt để tùy chỉnh.
Link to this sectionVí dụ về việc sử dụng phần Reference#
Có thể bạn đang tự hỏi, tại sao việc hiểu các phần khác nhau của codebase Ultralytics lại quan trọng? Nếu bạn biết phần nào của code xử lý công việc gì, bạn sẽ dễ dàng tìm thấy thông tin mình cần, thực hiện các thay đổi hoặc khắc phục sự cố hơn rất nhiều.
Dưới đây là một số ví dụ về cách bạn có thể sử dụng phần Reference của tài liệu:
- Nếu bạn đang tự hỏi, "Làm thế nào để model thực hiện dự đoán?", bạn có thể truy cập danh mục Models trong phần Reference, chọn loại model (như YOLO), chọn một tác vụ (như detect) và sau đó mở trang Predict để biết chi tiết.
- Nếu bạn muốn biết cách data augmentations đang được áp dụng, bạn có thể khám phá trang Augment trong danh mục Data. Nó liệt kê các kỹ thuật augmentation tích hợp sẵn được sử dụng để cải thiện hiệu suất model và sự đa dạng trong dữ liệu training.
Link to this sectionKhám phá kết quả thông qua phần Reference#
Phần Reference cũng hữu ích khi bạn đang cố gắng hiểu các đầu ra do model của mình trả về. Sau khi một model như YOLO11 được sử dụng để chạy inference trên một hình ảnh, nó sẽ trả về một bộ kết quả mô tả những gì đã được phát hiện.
Ví dụ, trong một luồng camera, nó có thể phát hiện một người và đánh dấu vị trí của họ bằng một bounding box, cùng với điểm số tin cậy (confidence score) - một giá trị từ 0 đến 1 cho biết độ chắc chắn của model về kết quả phát hiện.
Nếu bạn đang cố gắng hiểu cách sử dụng đầu ra đó trong dự án của mình, phần Reference có thể hướng dẫn bạn. Nó bao gồm một trang cho module Results phân tích chi tiết những gì được bao gồm và cách truy cập nó trong code của bạn. Có các chi tiết về cách xem các khung phát hiện, kiểm tra điểm số tin cậy, hiển thị kết quả hoặc lưu chúng lại.

Hình 5. Một ví dụ về cách kết quả do YOLO11 trả về có thể được trực quan hóa.
Link to this sectionCác điểm chính cần lưu ý#
Tài liệu Ultralytics giúp bạn hiểu cách sử dụng các model YOLO một cách hiệu quả. Nó giải thích các quy trình chính như training model, chuẩn bị dữ liệu và làm việc với kết quả. Mỗi trang đều có các giải thích rõ ràng và đoạn code ví dụ để giúp bạn bắt đầu nhanh chóng.
Nếu bạn tò mò về những gì diễn ra ở hậu trường, phần Reference của tài liệu cũng phân tích nó từng bước một. Nó cho thấy code được cấu trúc như thế nào, từng phần làm gì và mọi thứ hoạt động cùng nhau ra sao. Điều này giúp bạn dễ dàng học hỏi, tùy chỉnh và tự tin xây dựng các dự án computer vision của riêng mình.
Hãy là một phần của cộng đồng năng động của chúng tôi và khám phá kho lưu trữ GitHub để tìm hiểu thêm về việc xây dựng với AI. Sẵn sàng ra mắt các ý tưởng computer vision của riêng bạn? Hãy truy cập các tùy chọn cấp phép của chúng tôi để bắt đầu. Xem cách vision AI trong ô tô và AI trong chăm sóc sức khỏe đang tạo ra tác động bằng cách truy cập các trang giải pháp của chúng tôi.






