Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Tích hợp

Sử dụng các kỹ thuật tăng cường dữ liệu Albumentations để đa dạng hóa dữ liệu của bạn

Tìm hiểu cách sử dụng Albumentations để tăng cường dữ liệu khi tùy chỉnh huấn luyện Ultralytics YOLO11 nhằm cải thiện hiệu suất model với dữ liệu huấn luyện đa dạng.

ABAbirami Vina
5 min read
Tăng cường dữ liệu Albumentations giúp đa dạng hóa hình ảnh huấn luyện YOLO11

Khi xây dựng một giải pháp thị giác máy tính, việc thu thập một tập hợp hình ảnh đa dạng để huấn luyện các model AI thị giác là một phần quan trọng của quy trình. Việc này thường tiêu tốn nhiều thời gian và tiền bạc, và đôi khi các hình ảnh thu thập được vẫn không đủ phong phú để các model học tập hiệu quả.

Ví dụ, các model thị giác máy tính như Ultralytics YOLO11 có thể được huấn luyện tùy chỉnh trên các tập dữ liệu hình ảnh cho nhiều tác vụ thị giác máy tính khác nhau liên quan đến các ứng dụng khác nhau. Dữ liệu đa dạng là yếu tố then chốt vì nó giúp model tổng quát hóa tốt hơn, cho phép model nhận diện đối tượng và các mẫu trong nhiều tình huống thực tế.

Nếu bạn đang gặp khó khăn vì thiếu dữ liệu đa dạng, các kỹ thuật tăng cường dữ liệu hình ảnh có thể là một giải pháp tuyệt vời. Các phương pháp như xoay, lật và điều chỉnh độ sáng có thể giúp tăng sự đa dạng cho tập dữ liệu của bạn, cải thiện khả năng xử lý nhiều điều kiện khác nhau của model.

Đó là lý do tại sao Ultralytics hỗ trợ tích hợp cho việc tăng cường dữ liệu hình ảnh. Sử dụng Albumentations, một công cụ phổ biến cung cấp hàng loạt các biến đổi, bạn có thể tạo ra dữ liệu hình ảnh đa dạng. Sự tích hợp này đơn giản hóa quy trình huấn luyện YOLO11 bằng cách tự động tăng cường các hình ảnh huấn luyện, dẫn đến hiệu suất model được cải thiện.

Trong bài viết này, chúng ta sẽ khám phá cách bạn có thể sử dụng tích hợp Albumentations, các lợi ích của nó và tác động của nó đối với quá trình huấn luyện model.

Link to this sectionAlbumentations là gì?#

Các model thị giác máy tính có thể học từ một tập hợp lớn các hình ảnh chất lượng cao để nhận diện đối tượng trong các môi trường khác nhau. Việc thu thập các tập dữ liệu lớn từ các nguồn thực tế có thể chậm, tốn kém và kém hiệu quả. Để hợp lý hóa tác vụ này, bạn có thể sử dụng tăng cường dữ liệu hình ảnh để tạo ra các biến thể mới từ các hình ảnh hiện có, giúp các model học từ các kịch bản khác nhau mà không cần phải thu thập thêm dữ liệu.

Cụ thể, bạn có thể tận dụng Albumentations, một thư viện mã nguồn mở được giới thiệu để tăng cường dữ liệu hình ảnh hiệu quả vào năm 2018. Nó hỗ trợ nhiều thao tác khác nhau, từ các thay đổi hình học đơn giản như xoay và lật cho đến các điều chỉnh phức tạp hơn như độ sáng, độ tương phản và thêm nhiễu.

Ví dụ về các loại tăng cường dữ liệu ảnh khác nhau

Hình 1. Các ví dụ về các loại tăng cường dữ liệu hình ảnh khác nhau.

Link to this sectionCác tính năng chính của Albumentations#

Albumentations nổi tiếng với hiệu suất cao, có nghĩa là nó có thể xử lý hình ảnh một cách nhanh chóng và hiệu quả. Được xây dựng trên các thư viện được tối ưu hóa như OpenCV và NumPy, nó xử lý các tập dữ liệu lớn với thời gian xử lý tối thiểu, khiến nó trở nên lý tưởng cho việc tăng cường dữ liệu nhanh chóng trong quá trình huấn luyện model.

Dưới đây là một số tính năng chính khác của Albumentations:

  • Phạm vi biến đổi rộng: Albumentations cung cấp hơn 70 loại tăng cường. Các biến thể này giúp các model học cách phát hiện đối tượng bất chấp các thay đổi về ánh sáng, góc độ hoặc nền.
  • Tối ưu hóa về tốc độ: Nó sử dụng các kỹ thuật tối ưu hóa nâng cao như SIMD (Single Instruction, Multiple Data), giúp xử lý nhiều điểm dữ liệu cùng lúc để đẩy nhanh quá trình tăng cường hình ảnh và xử lý hiệu quả các tập dữ liệu lớn.
  • Ba cấp độ tăng cường: Nó nâng cao dữ liệu theo ba cách. Ví dụ, tăng cường ở cấp độ pixel điều chỉnh độ sáng và màu sắc mà không làm thay đổi các đối tượng. Trong khi đó, tăng cường ở cấp độ không gian thay đổi vị trí đối tượng trong khi vẫn giữ nguyên các chi tiết quan trọng, và tăng cường ở cấp độ trộn dữ liệu kết hợp các phần của các hình ảnh khác nhau để tạo ra các mẫu mới.

Link to this sectionTại sao bạn nên sử dụng tích hợp Albumentations?#

Bạn có thể tự hỏi: có nhiều cách để áp dụng tăng cường cho một tập dữ liệu, và bạn thậm chí có thể tự tạo ra các phép tăng cường bằng các công cụ như OpenCV. Vậy tại sao lại chọn một tích hợp hỗ trợ thư viện như Albumentations?

Việc tạo các phép tăng cường thủ công với các công cụ như OpenCV có thể mất nhiều thời gian và đòi hỏi kiến thức chuyên môn. Việc tinh chỉnh các biến đổi để đạt được kết quả tốt nhất cũng có thể khá phức tạp. Tích hợp Albumentations giúp quy trình này dễ dàng hơn. Nó cung cấp nhiều phép biến đổi có sẵn giúp bạn tiết kiệm thời gian và công sức khi chuẩn bị tập dữ liệu.

Một lý do khác để chọn tích hợp Albumentations là nó hoạt động trơn tru với quy trình huấn luyện model của Ultralytics. Nó giúp việc huấn luyện tùy chỉnh YOLO11 trở nên dễ dàng hơn nhiều, vì các phép tăng cường được tự động áp dụng trong quá trình huấn luyện. Nó đơn giản hóa quy trình, nhờ đó bạn có thể tập trung hơn vào việc cải thiện model thay vì xử lý việc chuẩn bị dữ liệu.

Link to this sectionBắt đầu với tích hợp Albumentations#

Thú vị là, việc sử dụng tích hợp Albumentations để huấn luyện YOLO11 đơn giản hơn vẻ ngoài của nó. Khi các thư viện phù hợp đã được cài đặt, tích hợp sẽ tự động áp dụng các phép tăng cường dữ liệu hình ảnh trong quá trình huấn luyện. Nó giúp model học từ các biến thể hình ảnh khác nhau bằng cùng một tập dữ liệu.

Tiếp theo, hãy cùng tìm hiểu cách cài đặt và sử dụng tích hợp Albumentations khi huấn luyện tùy chỉnh YOLO11.

Link to this sectionCài đặt gói Python Ultralytics và Albumentations#

Trước khi áp dụng các phép tăng cường, cả gói Python của Ultralytics và Albumentations đều cần được cài đặt. Tích hợp này đã được xây dựng để cả hai thư viện hoạt động cùng nhau một cách liền mạch theo mặc định, vì vậy bạn không cần lo lắng về các cấu hình phức tạp.

Toàn bộ quy trình cài đặt có thể được hoàn thành chỉ trong vài phút với một lệnh pip duy nhất, đây là công cụ quản lý gói để cài đặt các thư viện Python, như được hiển thị trong hình ảnh bên dưới.

Cài đặt Ultralytics và Albumentations bằng pip

Hình 2. Cài đặt Ultralytics và Albumentations.

Khi đã cài đặt Albumentations, chế độ huấn luyện model của Ultralytics sẽ tự động áp dụng các phép tăng cường hình ảnh trong quá trình huấn luyện. Nếu Albumentations không được cài đặt, các phép tăng cường này sẽ không được áp dụng. Để biết thêm chi tiết, bạn có thể tham khảo tài liệu chính thức của Ultralytics.

Link to this sectionHuấn luyện YOLO11 với sự trợ giúp của tích hợp Albumentations#

Hãy tìm hiểu rõ hơn về những gì diễn ra bên dưới tích hợp Albumentations.

Dưới đây là cái nhìn chi tiết hơn về các phép tăng cường được áp dụng trong quá trình huấn luyện YOLO11:

  • Làm mờ (Blur): Phép biến đổi này thêm một chút độ mờ vào hình ảnh. Nó giúp model phát hiện các đối tượng ngay cả khi chúng bị mất nét.
  • Làm mờ trung vị (Median blur): Nó giảm nhiễu ngẫu nhiên trong khi vẫn bảo toàn các cạnh của đối tượng trong hình ảnh. Điều này giúp model phát hiện đối tượng trong các môi trường phức tạp dễ dàng hơn.
  • Ảnh xám (Grayscale): Bằng cách chuyển đổi hình ảnh sang đen trắng, phép tăng cường này có thể giúp model tập trung vào hình dạng và kết cấu thay vì màu sắc.
  • CLAHE (Contrast limited adaptive histogram equalization - Cân bằng histogram thích nghi giới hạn độ tương phản): Phép tăng cường này tăng cường độ tương phản trong hình ảnh, đặc biệt là ở những vùng quá tối hoặc khó nhìn, chẳng hạn như trong điều kiện thiếu sáng hoặc mờ sương. Điều này làm cho các đối tượng ở những vùng đó rõ ràng hơn và dễ nhận diện hơn đối với model.

Tăng cường ảnh thang độ xám áp dụng cho ảnh một con mèo

Hình 3. Ví dụ về một phép tăng cường Grayscale áp dụng cho ảnh một con mèo.

Link to this sectionCác ứng dụng của YOLO11 và tích hợp Albumentations#

Nếu bạn đang huấn luyện tùy chỉnh YOLO11 cho một ứng dụng cụ thể, tích hợp Albumentations có thể giúp nâng cao hiệu suất của model bằng cách thích nghi với các điều kiện khác nhau. Hãy cùng thảo luận về một số ứng dụng thực tế và những thách thức mà tích hợp này có thể giải quyết.

Link to this sectionCải thiện hình ảnh y tế#

AI thị giác trong chăm sóc sức khỏe đang giúp các bác sĩ phân tích hình ảnh y tế chính xác hơn để hỗ trợ chẩn đoán và cải thiện dịch vụ chăm sóc bệnh nhân. Trên thực tế, khoảng một phần năm các tổ chức y tế đã và đang sử dụng các giải pháp AI.

Tuy nhiên, việc tạo ra các giải pháp thị giác máy tính này đi kèm với những thách thức riêng. Các bản quét y tế có thể khác nhau rất nhiều giữa các bệnh viện, do chịu ảnh hưởng của các yếu tố như thiết bị, cài đặt khác nhau và thậm chí là kinh nghiệm của kỹ thuật viên. Các biến thể về độ sáng, độ tương phản và độ phơi sáng có thể ảnh hưởng đến sự nhất quán và độ chính xác của các model AI thị giác, gây khó khăn cho việc hoạt động tin cậy trong các môi trường khác nhau.

Đây là lúc việc tích hợp các công cụ như Albumentations trở nên thiết yếu. Bằng cách tạo ra nhiều phiên bản tăng cường của cùng một bản quét, Albumentations cho phép model học từ nhiều chất lượng hình ảnh khác nhau. Điều này giúp model trở nên mạnh mẽ hơn, cho phép nó phát hiện bệnh chính xác trên cả hình ảnh chất lượng cao và thấp.

Ảnh X-ray đã qua tăng cường

Hình 4. Hình ảnh X-ray tăng cường.

Link to this sectionTăng cường an ninh và giám sát#

Một ứng dụng thú vị khác của AI thị giác là trong lĩnh vực an ninh và giám sát. Phát hiện đối tượng thời gian thực có thể giúp đội ngũ an ninh xác định các mối đe dọa tiềm tàng một cách nhanh chóng.

Một mối quan tâm chính liên quan đến ứng dụng này là các camera an ninh ghi lại cảnh quay trong nhiều điều kiện ánh sáng khác nhau suốt cả ngày, và những điều kiện này có thể ảnh hưởng đáng kể đến cách một model hiểu những hình ảnh đó. Các yếu tố như môi trường thiếu sáng, ánh sáng chói hoặc tầm nhìn kém có thể gây khó khăn cho các model thị giác máy tính trong việc phát hiện đối tượng hoặc nhận diện các mối đe dọa tiềm tàng một cách nhất quán.

Tích hợp Albumentations giúp ích bằng cách áp dụng các phép biến đổi để mô phỏng các điều kiện ánh sáng khác nhau. Điều này cho phép model học cách phát hiện đối tượng trong cả môi trường sáng và thiếu sáng, làm cho model trở nên tin cậy hơn và cải thiện thời gian phản hồi trong các điều kiện đầy thách thức.

Link to this sectionĐịnh nghĩa lại quy trình bán lẻ và trải nghiệm khách hàng#

Một sự cố tràn đổ trong lối đi siêu thị, một con chó chạy qua cửa hàng, hoặc một đứa trẻ làm đổ một quầy trưng bày sản phẩm chỉ là một vài ví dụ về các sự kiện hàng ngày có thể là các trường hợp biên đối với AI thị giác trong ngành bán lẻ. Thị giác máy tính ngày càng được sử dụng để cải thiện trải nghiệm khách hàng bằng cách theo dõi hành vi mua sắm, giám sát lưu lượng người và xác định sản phẩm trên kệ. Tuy nhiên, những tình huống thực tế này có thể gây khó khăn cho các hệ thống AI trong việc hiểu và xử lý chính xác.

Mặc dù không phải kịch bản nào cũng có thể được thể hiện trong một tập dữ liệu thị giác máy tính, nhưng tích hợp Albumentations giúp ích bằng cách tăng cường dữ liệu để bao phủ nhiều tình huống có thể xảy ra, chẳng hạn như ánh sáng bất ngờ, góc độ bất thường hoặc vật cản. Điều này giúp các model thị giác máy tính thích nghi với nhiều điều kiện khác nhau, cải thiện khả năng xử lý các trường hợp biên và đưa ra dự đoán chính xác trong môi trường bán lẻ năng động.

Link to this sectionCác điểm chính cần lưu ý#

Việc thu thập dữ liệu thực tế đa dạng cho huấn luyện model có thể phức tạp, nhưng Albumentations làm cho việc đó trở nên dễ dàng hơn bằng cách tạo ra các biến thể hình ảnh giúp các model thích nghi với các điều kiện khác nhau.

Tích hợp Albumentations được hỗ trợ bởi Ultralytics giúp đơn giản hóa quy trình áp dụng các phép tăng cường này trong khi huấn luyện tùy chỉnh YOLO11. Điều này dẫn đến chất lượng tập dữ liệu tốt hơn, mang lại lợi ích cho nhiều ngành công nghiệp bằng cách tạo ra các model AI thị giác chính xác và đáng tin cậy hơn.

Hãy tham gia cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI, và xem qua các tùy chọn cấp phép của chúng tôi để bắt đầu các dự án AI thị giác của bạn. Bạn quan tâm đến các đổi mới như AI trong sản xuất hoặc thị giác máy tính trong xe tự lái? Hãy ghé thăm các trang giải pháp của chúng tôi để khám phá thêm.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning