Ultralytics YOLO

Cách sử dụng phần Tham chiếu của tài liệu Ultralytics YOLO

Tìm hiểu cách sử dụng phần Tham chiếu (Reference) của tài liệu Ultralytics YOLO để hiểu những gì nằm bên dưới gói Python của Ultralytics.

ABAbirami Vina4 min readApril 9, 2025

Sử dụng phần Tham chiếu của tài liệu Ultralytics YOLO

Ngày nay, trí tuệ nhân tạo (AI) trở nên dễ tiếp cận hơn bao giờ hết, giúp bất kỳ ai cũng có thể bắt đầu tìm hiểu và nhanh chóng sử dụng các model AI khác nhau cho nhiều tác vụ tiên tiến.

Ví dụ, computer vision là một nhánh của AI cho phép máy tính diễn giải và hiểu thông tin hình ảnh từ ảnh và video, và các model computer vision như Ultralytics YOLO11 rất dễ dàng để bắt đầu.

YOLO11 hỗ trợ các tác vụ như object detection, instance segmentation và image classification, đồng thời có thể được sử dụng cho các ứng dụng như lái xe tự động, giám sát an ninh và phân tích bán lẻ.

YOLO11 đang phát hiện nhiều đối tượng khác nhau

Hình 1. YOLO11 có thể được sử dụng để phát hiện nhiều đối tượng khác nhau.

Cụ thể, Ultralytics Python package cung cấp các công cụ thân thiện với người dùng để nhanh chóng huấn luyện, tùy chỉnh và triển khai các model AI này, cho phép người dùng ở mọi cấp độ kỹ năng dễ dàng xây dựng các ứng dụng computer vision tiên tiến.

Tuy nhiên, nếu bạn quan tâm đến việc tìm hiểu sâu hơn về cách mọi thứ vận hành hoặc tạo các tùy chỉnh riêng, phần Reference của tài liệu Ultralytics là một tài nguyên tuyệt vời. Phần này bao gồm cơ chế hoạt động nội bộ của Ultralytics Python package, bao gồm cách xử lý dữ liệu, quy trình huấn luyện model và cách bạn có thể trực quan hóa các dự đoán.

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn phần Reference của tài liệu Ultralytics và cách sử dụng nó khi làm việc trên các dự án computer vision. Hãy bắt đầu nào!

Link to this sectionTìm hiểu sâu hơn về cách làm việc với các model Ultralytics YOLO#

Làm việc với Ultralytics Python package rất đơn giản và trực quan. Bạn có thể huấn luyện các model YOLO hoặc detect objects trong ảnh chỉ với vài dòng code.

Tuy nhiên, một khi bạn đã quen với việc làm việc với các model computer vision, phần Reference của tài liệu Ultralytics sẽ giúp bạn hiểu sâu hơn về cách code hoạt động và những hàm nào mà package hỗ trợ. Nó cũng bao gồm các giải thích dễ theo dõi, các tùy chọn cấu hình và liên kết đến code liên quan có sẵn trong kho lưu trữ Ultralytics GitHub.

Nó giải thích cách cấu trúc của Ultralytics Python package và bao gồm các thành phần chính như thiết lập model, tải dữ liệu, quy trình huấn luyện, cũng như cách các dự đoán được thực hiện và trả về.

Mọi thứ được tổ chức thành các danh mục rõ ràng, vì vậy rất dễ dàng để tìm thấy những gì bạn đang tìm kiếm. Ví dụ, nếu bạn đang huấn luyện một model với bộ dữ liệu của riêng mình, bạn có thể đi đến phần Reference tập trung vào dữ liệu, và nó sẽ giúp bạn hiểu rõ hơn về cách dữ liệu của bạn sẽ được sử dụng để huấn luyện model.

Link to this sectionCách bắt đầu với phần Reference#

Nếu bạn đi đến phần Reference trong tài liệu Ultralytics YOLO, bạn sẽ thấy một menu ở bên trái trang với các danh mục tham khảo khác nhau. Mỗi danh mục đại diện cho một phần cụ thể của codebase Ultralytics, chẳng hạn như models, xử lý dữ liệu hoặc các hàm huấn luyện.

Nhấp vào một danh mục sẽ đưa bạn đến trang cung cấp thêm chi tiết.

Menu các danh mục Tham chiếu khác nhau ở bên trái trang

Hình 2. Ở bên trái, bạn sẽ tìm thấy menu các danh mục Reference khác nhau.

Tương tự, ở phía bên phải trang, bạn sẽ tìm thấy mục lục phân tách từng trang tham khảo thành các thành phần chính như hàm (các khối code có thể tái sử dụng), lớp (bản thiết kế để tạo đối tượng) và phương thức (hàm được định nghĩa bên trong lớp). Điều này giúp dễ dàng nhảy thẳng đến những gì bạn đang tìm kiếm.

Mục lục cho trang Tham chiếu ở bên phải

Hình 3. Ở bên phải, bạn sẽ tìm thấy mục lục cho trang Reference cụ thể mà bạn đang xem.

Link to this sectionCấu trúc của kho lưu trữ Ultralytics GitHub#

Kho lưu trữ Ultralytics GitHub được tổ chức thành các thư mục con hoặc gói con dựa trên các phần khác nhau của Ultralytics package, chẳng hạn như models, training và data. Phần Reference trong tài liệu tuân theo cấu trúc tương tự, giúp dễ hiểu hơn về cách mọi thứ kết hợp với nhau.

Dưới đây là một số thư mục con hoặc danh mục chính mà bạn sẽ thấy trong cả kho lưu trữ Ultralytics GitHub và phần Reference của tài liệu Ultralytics:

Models: Phần này tập trung vào các model khác nhau và modes của chúng, chẳng hạn như tạo dự đoán, xác thực hiệu suất và xuất các model đã huấn luyện.
Engine: Chứa logic cốt lõi để huấn luyện, xác thực, dự đoán, xuất và đánh giá các model.
Data: Quản lý cách tải, xử lý và tăng cường dữ liệu. Điều này bao gồm các hàm để tạo dataloaders (công cụ cung cấp dữ liệu cho model theo lô), áp dụng các phép biến đổi (các thay đổi được thực hiện đối với hình ảnh như thay đổi kích thước hoặc lật để giúp model học tốt hơn) và chuẩn bị dữ liệu (tổ chức và định dạng hình ảnh và nhãn) để huấn luyện.
Utils: Phần này cung cấp nhiều loại hàm hỗ trợ được sử dụng trên toàn bộ codebase, chẳng hạn như công cụ trực quan hóa, xử lý tệp và tính toán chỉ số.
HUB: Kết nối với Ultralytics HUB, một nền tảng computer vision không cần code, cho phép các tính năng đám mây như đăng nhập, tải lên model và quản lý bộ dữ liệu thông qua API.
Trackers: Triển khai logic theo dõi đối tượng cho các ứng dụng liên quan đến video hoặc chuỗi hình ảnh theo từng khung hình.

Mỗi thư mục con trong kho lưu trữ GitHub có một phần tương ứng trong tài liệu. Cấu trúc này được cố tình phản chiếu, giúp việc chuyển đổi giữa việc đọc tài liệu và khám phá source code trở nên dễ dàng hơn.

Trên thực tế, trong nhiều trang Reference, source code thực tế cũng được hiển thị, vì vậy bạn có thể thấy chính xác cách các hàm và lớp được triển khai mà không cần rời khỏi tài liệu.

Mã nguồn được bao gồm trong các trang Tham chiếu

Hình 4. Source code cũng được bao gồm trong các trang Reference.

Link to this sectionHiểu về các thành phần models, engine và data#

Giờ đây khi chúng ta đã thấy cách phần Reference được tổ chức, hãy xem xét kỹ hơn ba phần chính của Ultralytics package: models, engine và data.

Thư mục con models chứa code định nghĩa cách mỗi loại model hoạt động. Nó được tổ chức theo cả loại model (như YOLO, FastSAM hoặc RT-DETR) và các tác vụ như detection, segmentation hoặc classification. Bên trong mỗi phần này, bạn sẽ tìm thấy các tệp hoặc mô-đun xử lý các hành động cụ thể - ví dụ, cách model thực hiện dự đoán, cách nó được huấn luyện hoặc cách performance của nó được đánh giá.

Trong khi đó, thư mục con engine hoạt động phía sau để quản lý toàn bộ quy trình. Trong khi thư mục con models tập trung vào những gì mỗi model thực hiện, thư mục con engine tập trung vào cách thực hiện các tác vụ đó một cách nhất quán và hiệu quả.

Ngoài ra, thư mục con data chịu trách nhiệm tải và chuẩn bị các bộ dữ liệu. Phần này của codebase đảm bảo rằng dữ liệu huấn luyện của bạn sạch, có cấu trúc và đa dạng, giúp model học tốt hơn và tổng quát hóa hiệu quả hơn.

Sự tách biệt rõ ràng này giúp code dễ bảo trì hơn và mang lại cho người dùng sự linh hoạt để tùy chỉnh.

Link to this sectionCác ví dụ về cách sử dụng phần Reference#

Bạn có thể tự hỏi, tại sao việc hiểu các phần khác nhau của Ultralytics codebase lại quan trọng? Nếu bạn biết phần nào của code xử lý việc gì, việc tìm kiếm thông tin bạn cần, thực hiện thay đổi hoặc khắc phục sự cố sẽ trở nên dễ dàng hơn nhiều.

Dưới đây là một số ví dụ về cách bạn có thể sử dụng phần Reference của tài liệu:

Nếu bạn đang tự hỏi, “Làm thế nào để model đưa ra dự đoán?”, bạn có thể đi đến danh mục Models trong phần Reference, chọn một loại model (như YOLO), chọn một tác vụ (như detect), và sau đó mở trang Predict để biết chi tiết.
Nếu bạn muốn biết cách data augmentations được áp dụng, bạn có thể khám phá trang Augment trong danh mục Data. Nó liệt kê các kỹ thuật tăng cường dữ liệu tích hợp được sử dụng để cải thiện hiệu suất model và sự đa dạng trong dữ liệu huấn luyện.

Link to this sectionKhám phá kết quả thông qua phần Reference#

Phần Reference cũng hữu ích khi bạn đang cố gắng hiểu các đầu ra do model của bạn trả về. Sau khi một model như YOLO11 được sử dụng để thực hiện inference trên một hình ảnh, nó trả về một tập hợp các kết quả mô tả những gì đã được phát hiện.

Ví dụ, trong một nguồn cấp dữ liệu camera, nó có thể phát hiện một người và làm nổi bật vị trí của họ bằng bounding box, cùng với một confidence score - một giá trị từ 0 đến 1 cho biết model chắc chắn như thế nào về kết quả phát hiện đó.

Nếu bạn đang cố gắng hiểu cách sử dụng đầu ra đó trong dự án của mình, phần Reference có thể hướng dẫn bạn. Nó bao gồm một trang cho Results module phân tích những gì được bao gồm và cách truy cập nó trong code của bạn. Có các chi tiết về cách xem khung phát hiện, kiểm tra confidence score, hiển thị kết quả hoặc lưu chúng.

Ví dụ về cách trực quan hóa các kết quả do YOLO11 trả về

Hình 5. Một ví dụ về cách kết quả trả về bởi YOLO11 có thể được trực quan hóa.

Link to this sectionCác điểm chính cần lưu ý#

Tài liệu Ultralytics giúp bạn hiểu cách sử dụng các model YOLO một cách hiệu quả. Nó giải thích các quy trình chính như huấn luyện model, chuẩn bị dữ liệu và làm việc với kết quả. Mỗi trang đều có các giải thích rõ ràng và các đoạn code ví dụ để giúp bạn bắt đầu nhanh chóng.

Nếu bạn tò mò về những gì diễn ra phía sau hậu trường, phần Reference của tài liệu cũng phân tích từng bước một. Nó cho thấy cách code được cấu trúc, mỗi phần làm gì và cách mọi thứ kết hợp với nhau. Điều này giúp dễ dàng học hỏi, tùy chỉnh và tự tin xây dựng các dự án computer vision của riêng bạn.

Hãy tham gia cộng đồng năng động của chúng tôi và khám phá kho lưu trữ GitHub để tìm hiểu thêm về việc xây dựng ứng dụng với AI. Bạn đã sẵn sàng triển khai các ý tưởng thị giác máy tính của riêng mình chưa? Hãy truy cập các tùy chọn cấp phép của chúng tôi để bắt đầu. Xem cách thị giác AI trong ngành ô tô và AI trong chăm sóc sức khỏe đang tạo ra tác động bằng cách truy cập các trang giải pháp của chúng tôi.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Cách sử dụng phần Tham chiếu của tài liệu Ultralytics YOLO

Link to this sectionTìm hiểu sâu hơn về cách làm việc với các model Ultralytics YOLO#

Link to this sectionCách bắt đầu với phần Reference#

Link to this sectionCấu trúc của kho lưu trữ Ultralytics GitHub#

Link to this sectionHiểu về các thành phần models, engine và data#

Link to this sectionCác ví dụ về cách sử dụng phần Reference#

Link to this sectionKhám phá kết quả thông qua phần Reference#

Link to this sectionCác điểm chính cần lưu ý#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!