Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Hướng dẫn

Khám phá học có giám sát so với học không giám sát trong thị giác máy tính

Tìm hiểu sự khác biệt giữa học có giám sát và học không giám sát trong thị giác máy tính và cách chọn phương pháp tiếp cận phù hợp cho dữ liệu và mục tiêu dự án của bạn.

ABAbirami Vina
7 min read
Học có giám sát so với học không giám sát trong thị giác máy tính

Trí tuệ nhân tạo (AI) được xây dựng dựa trên khái niệm cốt lõi là dạy cho máy móc cách học hỏi và suy luận theo những cách tương tự như trí tuệ con người. Giống như cách con người học thông qua các phương pháp khác nhau, chẳng hạn như hướng dẫn trực tiếp hoặc bằng cách quan sát các mô hình và kinh nghiệm, các hệ thống AI và machine learning được thiết kế để tuân theo những phương pháp tiếp cận tương tự.

Cụ thể, khi nói đến các thuật toán machine learning, các hệ thống được huấn luyện để học từ dữ liệu thay vì được lập trình một cách rõ ràng cho mọi tác vụ. Thay vì dựa vào các quy tắc cố định, các mô hình machine learning nhận diện các mô hình trong dữ liệu và sử dụng những mô hình đó để đưa ra dự đoán hoặc quyết định.

Ví dụ, thị giác máy tính là một nhánh của AI và machine learning tập trung vào việc cho phép các hệ thống diễn giải và hiểu thông tin hình ảnh, chẳng hạn như hình ảnh và video. Từ việc nhận diện đối tượng đến xác định các mô hình ẩn trên các tập dữ liệu lớn, các hệ thống này phụ thuộc rất nhiều vào cách chúng được huấn luyện để học.

Nhiều kỹ thuật học AI khác nhau được sử dụng để huấn luyện các hệ thống này, tùy thuộc vào loại dữ liệu khả dụng và vấn đề cần giải quyết.

Một số mô hình thị giác máy tính học từ dữ liệu được gắn nhãn, trong đó mỗi đầu vào được ghép nối với một câu trả lời đúng, nghĩa là mọi hình ảnh hoặc điểm dữ liệu đều đi kèm với một nhãn được định nghĩa trước cho biết mô hình đó đại diện cho cái gì. Điều này cho phép mô hình tìm hiểu mối quan hệ giữa đầu vào và đầu ra mong đợi, cải thiện khả năng đưa ra các dự đoán chính xác trên dữ liệu mới chưa từng thấy.

Các mô hình thị giác khác học từ dữ liệu không được gắn nhãn, không có câu trả lời nào được cung cấp trước, thay vào đó tập trung vào việc xác định các mô hình và mối quan hệ trong chính dữ liệu đó. Những phương pháp này được gọi tương ứng là học có giám sáthọc không giám sát, và chúng tạo nên nền tảng của nhiều hệ thống thị giác máy tính tiên tiến.

Trong bài viết này, chúng ta sẽ khám phá học có giám sát và không giám sát, cách chúng được sử dụng trong thị giác máy tính và cách chọn phương pháp phù hợp nhất với dự án AI thị giác của bạn. Hãy cùng bắt đầu!

Link to this sectionCách các phương pháp học AI thúc đẩy thị giác máy tính#

Bạn có thể coi trí tuệ nhân tạo giống như một chiếc ô bao trùm hàng loạt công nghệ cho phép máy móc thực hiện các tác vụ vốn thường đòi hỏi trí tuệ con người. Trong chiếc ô này, machine learning là một lĩnh vực then chốt giúp các hệ thống có thể học từ dữ liệu thay vì chỉ dựa vào các quy tắc cố định.

Trong machine learning, các kỹ thuật học khác nhau quyết định cách một mô hình học và cải thiện theo thời gian. Các phương pháp như học có giám sát (học từ dữ liệu có nhãn với câu trả lời đúng), học không giám sát (nhận diện các mô hình trong dữ liệu không nhãn), học tăng cường (học thông qua thử và sai bằng cách sử dụng phản hồi hoặc phần thưởng), và học bán giám sát (kết hợp một lượng nhỏ dữ liệu có nhãn với một lượng lớn dữ liệu không nhãn) định nghĩa cách các hệ thống xử lý dữ liệu đầu vào và tạo ra dữ liệu đầu ra.

Tổng quan về các phương pháp học AI

Hình 1. Tổng quan về các phương pháp học AI (Nguồn)

Cụ thể, các hệ thống thị giác máy tính được xây dựng bằng cách sử dụng các phương pháp học như vậy để diễn giải và hiểu dữ liệu hình ảnh. Học có giám sát là phương pháp được sử dụng phổ biến nhất, vì nó cho phép các mô hình học hỏi từ các ví dụ được gắn nhãn rõ ràng và tạo ra kết quả chính xác, đáng tin cậy.

Ví dụ, một mô hình có thể được huấn luyện trên các hình ảnh được gắn nhãn là “mèo” và “chó”, học các đặc điểm như hình dạng, tai và cấu trúc khuôn mặt để có thể phân loại chính xác các hình ảnh mới bằng các thuật toán phân loại. Trong khi đó, học không giám sát và bán giám sát cũng được sử dụng trong thị giác máy tính, thường để khám phá các mô hình trong dữ liệu hoặc để cải thiện hiệu suất khi dữ liệu có nhãn bị hạn chế.

Link to this sectionTìm hiểu về việc sử dụng các mô hình học có giám sát trong thị giác máy tính#

Bạn có thể so sánh các thuật toán học có giám sát với bối cảnh lớp học, nơi giáo viên cung cấp các ví dụ cùng với câu trả lời đúng để học sinh có thể học điều gì đúng và điều gì sai. Trong machine learning, các mô hình học theo cách tương tự bằng cách sử dụng dữ liệu có nhãn, trong đó mỗi đầu vào được ghép nối với một đầu ra đã biết.

Giả sử bạn đang làm việc để xây dựng một hệ thống thị giác máy tính giúp tự động hóa việc phân tích các trận đấu bóng chày. Bạn có thể huấn luyện một mô hình như Ultralytics YOLO26 trên các hình ảnh hoặc khung hình video nơi các đối tượng như bóng, gậy và cầu thủ được gắn nhãn.

Mỗi đối tượng sẽ được đánh dấu bằng vị trí và danh mục của nó, cho phép mô hình học những gì cần tìm kiếm. Theo thời gian, mô hình có thể phát hiện và xác định vị trí các đối tượng này trong các cảnh quay mới, hỗ trợ các trường hợp sử dụng như theo dõi bóng và phát hiện cầu thủ trên các khung hình.

Một ví dụ về phát hiện đối tượng được hỗ trợ bởi học có giám sát

Hình 2. Ví dụ về phát hiện đối tượng được hỗ trợ bởi học có giám sát (Nguồn)

Ngoài phát hiện đối tượng, học có giám sát được sử dụng rộng rãi trong hàng loạt tác vụ thị giác máy tính như phân loại hình ảnh, phân đoạn đối tượng (instance segmentation) và ước tính tư thế (pose estimation), nơi độ chính xác và tính nhất quán là quan trọng. Trong mỗi tác vụ này, các mô hình học từ dữ liệu có nhãn để nhận diện các mô hình cụ thể và đưa ra các dự đoán đáng tin cậy trên các đầu vào mới.

Các mô hình này thường được xây dựng bằng deep learning, một loại machine learning sử dụng các mạng thần kinh (neural networks) để học các mô hình trực tiếp từ dữ liệu. Các mạng thần kinh được thiết kế để xử lý thông tin theo cách được lấy cảm hứng một cách lỏng lẻo từ cách não người hoạt động, cho phép các mô hình học các đặc điểm hình ảnh phức tạp từ các tập dữ liệu lớn.

Các phương pháp thị giác máy tính trước đây thường dựa vào các đặc điểm được thiết kế thủ công kết hợp với các thuật toán như máy vector hỗ trợ (SVM là các mô hình phân loại dữ liệu bằng cách tìm ranh giới tốt nhất giữa các danh mục) hoặc cây quyết định (các mô hình đưa ra quyết định bằng cách tách dữ liệu thành các nhánh).

Ngược lại, các mô hình thị giác máy tính ngày nay sử dụng deep learning để tự động học các đặc điểm này từ dữ liệu, giúp chúng hiệu quả hơn trong việc xử lý các tác vụ hình ảnh quy mô lớn và cực kỳ chi tiết.

Link to this sectionTìm hiểu nhu cầu về các mô hình học không giám sát trong AI thị giác#

Mặc dù học có giám sát là phương pháp được ưu tiên trong thị giác máy tính, nhưng có một số ứng dụng thị giác mà dữ liệu có nhãn không khả dụng hoặc quá đắt đỏ và tốn thời gian để tạo ra.

Trong những trường hợp này, các thuật toán học không giám sát có thể là một giải pháp thay thế hữu ích. Giả sử bạn có một bộ sưu tập lớn các bức ảnh không có nhãn từ camera theo dõi động vật hoang dã.

Không có nhãn nào cho biết mỗi hình ảnh chứa gì, nhưng bạn vẫn muốn sắp xếp hoặc hiểu dữ liệu đó. Một mô hình không giám sát có thể phân tích các hình ảnh này và nhóm các hình ảnh tương tự lại với nhau, tách biệt các loài động vật trông giống nhau thành các cụm, ngay cả khi không biết nhãn chính xác của chúng.

Link to this sectionHọc không giám sát hoạt động như thế nào trong thị giác máy tính#

Vậy, machine learning không giám sát hoạt động như thế nào? Thay vì học từ các câu trả lời đúng, mô hình học bằng cách tự mình nhận diện các mô hình và cấu trúc trong dữ liệu. Nó tìm kiếm sự tương đồng và khác biệt trên toàn bộ dữ liệu mà không cần dựa vào các ví dụ có nhãn.

Một trường hợp sử dụng phổ biến là phát hiện bất thường, nơi mô hình học xem dữ liệu bình thường trông như thế nào và sau đó xác định bất cứ điều gì sai lệch so với dữ liệu đó. Phát hiện bất thường và ngoại lai là một trong những ứng dụng công nghiệp có tác động mạnh mẽ nhất. Các ví dụ bao gồm phát hiện các sản phẩm bị lỗi trên dây chuyền sản xuất, gắn cờ các bản quét y tế bất thường để bác sĩ chẩn đoán hình ảnh xem xét hoặc phát hiện các hoạt động đáng ngờ trong cảnh quay giám sát. Do các lỗi và sự bất thường thường hiếm gặp và đa dạng, việc gắn nhãn mọi trường hợp có thể xảy ra là không thực tế, khiến các phương pháp không giám sát trở nên phù hợp một cách tự nhiên.

Để hỗ trợ điều này, các kỹ thuật như phân cụm (clustering) và giảm chiều dữ liệu (dimensionality reduction) thường được sử dụng, thường trên các đặc điểm được trích xuất từ hình ảnh thay vì chính các hình ảnh thô. Các phương pháp phân cụm, như phân cụm k-means, nhóm các hình ảnh tương tự lại với nhau dựa trên các mô hình chia sẻ, trong khi các kỹ thuật giảm chiều dữ liệu, chẳng hạn như phân tích thành phần chính (PCA), đơn giản hóa dữ liệu bằng cách tập trung vào các đặc điểm quan trọng nhất.

Điều này giúp mô hình dễ dàng xác định các mô hình và cấu trúc có ý nghĩa hơn trong các tập dữ liệu lớn và phức tạp. Ưu điểm chính của học không giám sát là nó hoạt động tốt với dữ liệu không có nhãn và có thể tiết lộ các mô hình không hiển nhiên ngay lập tức. Tuy nhiên, nó khó đánh giá hơn và cung cấp ít quyền kiểm soát hơn đối với đầu ra cuối cùng so với học có giám sát.

Link to this sectionHọc tự giám sát (self-supervised) và bán giám sát (semi-supervised) trong thị giác máy tính#

Khi tìm hiểu về học có giám sát và không giám sát, bạn có thể tự hỏi liệu có một điểm trung gian giữa hai phương pháp này hay không. Thật thú vị, học tự giám sát và bán giám sát đã thu hẹp khoảng cách giữa học có giám sát và không giám sát.

Các phương pháp này giúp các mô hình có thể học từ dữ liệu không có nhãn hiệu quả hơn. Thay vì chỉ dựa vào các ví dụ có nhãn, chúng hoặc tự tạo ra các tác vụ học tập từ dữ liệu hoặc kết hợp một tập dữ liệu có nhãn nhỏ với một tập dữ liệu không nhãn lớn hơn.

Trong học tự giám sát, mô hình học bằng cách giải quyết các tác vụ được tạo ra từ chính dữ liệu. Ví dụ, nó có thể được cung cấp một hình ảnh bị thiếu một phần và học cách dự đoán những gì nên lấp đầy không gian đó, hoặc nó có thể học cách nhận diện các góc nhìn khác nhau của cùng một đối tượng. Điều này giúp mô hình học các đặc điểm hữu ích mà không cần nhãn thủ công.

Mặt khác, trong học bán giám sát, một lượng nhỏ dữ liệu có nhãn được sử dụng cùng với một tập dữ liệu không nhãn lớn hơn để cải thiện hiệu suất. Trong một số trường hợp, mô hình có thể tạo nhãn cho dữ liệu không nhãn và sử dụng chúng để tiếp tục học.

Lợi ích chính của các phương pháp này là chúng giảm nhu cầu về các tập dữ liệu có nhãn lớn, vốn thường đắt đỏ và tốn thời gian để tạo. Tuy nhiên, chúng có thể phức tạp hơn để thiết kế và đánh giá so với các phương pháp hoàn toàn có giám sát.

Link to this sectionNhững khác biệt chính giữa học có giám sát và học không giám sát#

Sự khác biệt giữa học có giám sát và không giám sát nằm ở cách một mô hình học và những gì nó đang cố gắng đạt được. Trong khi học có giám sát dựa vào dữ liệu có nhãn và hướng dẫn rõ ràng để học các tác vụ cụ thể, học không giám sát hoạt động mà không có các câu trả lời định trước và tập trung vào việc khám phá các mô hình và cấu trúc trong dữ liệu.

Ví dụ, trong hệ thống giám sát giao thông, một mô hình học có giám sát có thể được huấn luyện trên các hình ảnh có nhãn để phát hiện phương tiện, người đi bộ hoặc tín hiệu giao thông. Ngược lại, một mô hình không giám sát có thể phân tích một lượng lớn cảnh quay video để nhóm các mô hình giao thông tương tự hoặc xác định các sự kiện bất thường, chẳng hạn như tắc nghẽn bất ngờ hoặc chuyển động bất thường, mà không cần được hướng dẫn rõ ràng về những gì cần tìm kiếm.

Link to this sectionKhi nào nên sử dụng học có giám sát trong thị giác máy tính#

Học có giám sát là một lựa chọn tuyệt vời cho các tác vụ thị giác máy tính nơi mục tiêu được xác định rõ ràng và mô hình cần ánh xạ dữ liệu đầu vào tới các đầu ra chính xác. Nó hoạt động đặc biệt hiệu quả khi bạn có một tập dữ liệu có nhãn đáng tin cậy và cần các kết quả nhất quán, có thể dự đoán được.

Các tác vụ thị giác máy tính được thúc đẩy bởi học có giám sát

Hình 3. Các tác vụ thị giác máy tính được thúc đẩy bởi học có giám sát (Nguồn)

Phương pháp này thường được sử dụng cho các vấn đề mà mô hình phải phân biệt giữa các danh mục đã biết hoặc dự đoán các kết quả cụ thể. Thay vì khám phá các mô hình, trọng tâm là học các mối quan hệ chính xác từ dữ liệu có nhãn, giúp dễ dàng hướng dẫn mô hình đạt được kết quả mong muốn.

Một ưu điểm chính khác là khả năng kiểm soát. Với học có giám sát, việc đo lường hiệu suất bằng các chỉ số rõ ràng, tinh chỉnh mô hình và đảm bảo hành vi ổn định trong quá trình triển khai sẽ dễ dàng hơn. Điều này khiến nó trở nên hoàn hảo cho các hệ thống đòi hỏi tính nhất quán và độ tin cậy theo thời gian.

Tuy nhiên, điều này đi kèm với một sự đánh đổi. Mô hình phụ thuộc rất nhiều vào chất lượng và quy mô của dữ liệu có nhãn, và việc thu thập cũng như chú thích dữ liệu đó có thể rất tốn thời gian.

Link to this sectionVí dụ thực tế về thị giác máy tính có giám sát#

Các mô hình AI thị giác như các mô hình Ultralytics YOLO sử dụng học có giám sát để thực hiện các tác vụ như phát hiện đối tượng với độ chính xác cao, đặc biệt là trong các ứng dụng thời gian thực. Dưới đây là một số trường hợp sử dụng thị giác thực tế phổ biến nơi học có giám sát tạo ra sự khác biệt:

  • Chăm sóc sức khỏe và chẩn đoán hình ảnh y tế: Bác sĩ có thể sử dụng các hệ thống thị giác máy tính được huấn luyện trên các bản quét có nhãn, chẳng hạn như tia X hoặc MRI, nơi các bộ phân loại được sử dụng để xác định các tình trạng như khối u hoặc gãy xương, hỗ trợ chẩn đoán nhanh hơn và chính xác hơn.
  • Kiểm tra chất lượng công nghiệp: Trong môi trường sản xuất, các hệ thống thị giác được huấn luyện trên dữ liệu có nhãn có thể kiểm tra sản phẩm bằng cách phân tích một số đặc điểm liên quan đến chất lượng, chẳng hạn như hình dạng, khiếm khuyết bề mặt, kết cấu và kích thước. Bằng cách học hỏi từ các ví dụ về cả sản phẩm đạt chuẩn và sản phẩm lỗi, các hệ thống này có thể nhất quán xác định các lỗi và duy trì tiêu chuẩn sản xuất.
  • Lái xe tự hành: Các hệ thống tự lái dựa trên các mô hình được huấn luyện trên dữ liệu lái xe có nhãn để nhận diện làn đường, phương tiện, người đi bộ và biển báo giao thông, giúp các phương tiện điều hướng an toàn trong thời gian thực.
  • Hệ thống bán lẻ và thanh toán: Các cửa hàng sử dụng các mô hình được huấn luyện trên hình ảnh sản phẩm có nhãn để xác định các mặt hàng trên kệ hoặc tại quầy thanh toán, cho phép thanh toán tự động và quản lý hàng tồn kho hiệu quả hơn. Các hệ thống này cũng có thể hỗ trợ các tác vụ như phân khúc khách hàng khi kết hợp với dữ liệu bổ sung, giúp doanh nghiệp hiểu rõ hơn về các kiểu mua sắm.
  • Nông nghiệp và giám sát cây trồng: Nông dân có thể sử dụng các mô hình được huấn luyện trên các hình ảnh có nhãn để phát hiện và phân loại cây trồng, chẳng hạn như nhận diện và đếm số lượng khoai tây khỏe mạnh và bị hư hại, giúp cải thiện kiểm soát chất lượng và giảm tổn thất.

Sử dụng YOLO để phát hiện và đếm khoai tây khỏe mạnh và bị lỗi

Hình 4. Sử dụng YOLO để phát hiện và đếm khoai tây khỏe mạnh và bị lỗi

Link to this sectionHọc không giám sát có thể giải quyết những loại vấn đề nào trong thị giác máy tính?#

Học không giám sát rất hữu ích khi bạn không có đủ dữ liệu có nhãn hoặc khi dữ liệu của bạn không đi kèm với các câu trả lời rõ ràng. Trong những tình huống này, mục tiêu không phải là đưa ra các dự đoán chính xác, mà là hiểu các mô hình và cấu trúc trong dữ liệu.

Phương pháp này thường được sử dụng khi khám phá một tập dữ liệu không nhãn lần đầu tiên. Thay vì nói với mô hình những gì cần tìm kiếm, bạn cho phép nó tự mình xác định sự tương đồng, nhóm các hình ảnh liên quan hoặc làm nổi bật các mô hình bất thường.

Trong một bộ sưu tập hình ảnh lớn, một phương pháp không giám sát có thể giúp sắp xếp các hình ảnh tương tự lại với nhau hoặc gắn cờ các dữ liệu ngoại lai có thể cần được chú ý thêm. Điều này làm cho nó trở thành một điểm khởi đầu hữu ích trong các dự án khoa học dữ liệu.

Các mô hình tạo sinh (generative models), bao gồm GAN, variational autoencoder và mô hình khuếch tán, học phân phối cơ bản của hình ảnh để tạo ra những hình ảnh hoàn toàn mới. Các mô hình này thúc đẩy các ứng dụng như tổng hợp hình ảnh, điền khuyết (inpainting), tăng độ phân giải (super-resolution) và chuyển đổi phong cách, và chúng tạo thành xương sống của các hệ thống AI tạo sinh ngày nay.

Trong phân đoạn không giám sát (unsupervised segmentation), một số phương pháp nhóm các pixel hoặc vùng thành các phân đoạn nhất quán mà không cần dựa vào các mặt nạ (masks) có nhãn, điều này rất hữu ích khi việc chú thích quá tốn kém hoặc khi mục tiêu là khám phá cấu trúc thay vì khớp với các danh mục được định nghĩa trước.

Học không giám sát cũng có tác động mạnh mẽ khi làm việc với các tập dữ liệu lớn nơi việc gắn nhãn tốn thời gian hoặc không khả thi. Trong những trường hợp như vậy, nó cho phép bạn thu được thông tin chi tiết từ dữ liệu mà không cần dựa vào dữ liệu huấn luyện có nhãn.

Nó cũng thường được sử dụng trong các lĩnh vực như AI tạo sinh (các mô hình tạo ra dữ liệu mới như hình ảnh, văn bản hoặc âm thanh) và học biểu diễn (các mô hình học các đặc điểm hoặc mô hình hữu ích từ dữ liệu thô), nơi các mô hình học các đặc điểm chung từ một lượng lớn dữ liệu. Nhìn chung, nếu vấn đề của bạn liên quan đến việc khám phá, khám phá mô hình hoặc làm việc với dữ liệu không có nhãn, học không giám sát là một phương pháp linh hoạt và thiết thực để xem xét.

Link to this sectionVí dụ thực tế về học không giám sát trong thị giác máy tính#

Dưới đây là một số ví dụ về các trường hợp sử dụng nơi học không giám sát được áp dụng trong thị giác máy tính:

  • Phát hiện bất thường trong sản xuất: Các mô hình có thể học xem các sản phẩm bình thường trông như thế nào và có thể gắn cờ các lỗi hoặc sự bất thường mà không cần các ví dụ có nhãn về mọi lỗi có thể xảy ra.
  • Sắp xếp và tìm kiếm hình ảnh: Các bộ sưu tập hình ảnh lớn, chẳng hạn như thư viện ảnh hoặc danh mục thương mại điện tử, có thể được tự động nhóm dựa trên sự tương đồng về hình ảnh, giúp các nhà khoa học dữ liệu dễ dàng sắp xếp, khám phá và tìm kiếm thông qua các tập dữ liệu lớn.
  • Giám sát và an ninh: Các hệ thống có thể phân tích cảnh quay video để xác định các mô hình hoặc hành vi bất thường, chẳng hạn như chuyển động bất ngờ hoặc thay đổi đám đông, mà không cần được huấn luyện rõ ràng trên các sự kiện có nhãn.
  • Tiền xử lý và khám phá dữ liệu: Các phương pháp không giám sát thường được sử dụng để khám phá và cấu trúc dữ liệu hình ảnh thô trước khi huấn luyện các mô hình có giám sát, giúp cải thiện chất lượng dữ liệu và giảm bớt nỗ lực thủ công.

Link to this sectionNhững hạn chế thực tế của học có giám sát và không giám sát#

Bất chấp những ưu điểm của cả hai phương pháp học, có những hạn chế nhất định cần xem xét. Dưới đây là một số yếu tố thực tế cần lưu ý khi xây dựng các mô hình thị giác máy tính:

  • Quá khớp (overfitting) trong các mô hình có giám sát: Trong học có giám sát, một mô hình có thể học quá sát dữ liệu huấn luyện thay vì học các mô hình tổng quát. Điều này thường xảy ra khi tập dữ liệu nhỏ hoặc không đủ đa dạng. Ví dụ, một mô hình được huấn luyện để phát hiện lỗi trên một loại sản phẩm có thể thất bại khi kiểm tra trên dữ liệu mới bao gồm các sản phẩm hơi khác biệt hoặc điều kiện ánh sáng khác nhau.
  • Thử thách với các thuật toán phân cụm: Trong học không giám sát, một mô hình có thể nhóm các điểm dữ liệu tương tự lại với nhau. Tuy nhiên, điều này có thể bị phá vỡ khi dữ liệu bị nhiễu, không nhất quán hoặc thiếu cấu trúc rõ ràng. Ví dụ, trong các tác vụ nhóm hình ảnh, các hình ảnh có màu sắc tương tự nhưng đối tượng khác nhau có thể bị nhóm lại với nhau một cách không chính xác.
  • Tầm quan trọng của việc tiền xử lý đúng cách: Trước khi huấn luyện, dữ liệu cần được làm sạch và chuẩn bị. Điều này thường được thực hiện bằng cách sử dụng các thư viện Python xử lý hình ảnh và chuyển đổi dữ liệu. Điều này đặc biệt quan trọng trong thị giác máy tính, nơi hình ảnh có thể khác nhau về kích thước, chất lượng hoặc ánh sáng. Nếu không có tiền xử lý đúng cách, các mô hình có thể học từ nhiễu thay vì các mô hình có ý nghĩa, dẫn đến hiệu suất kém.

Link to this sectionCác điểm chính cần lưu ý#

Trong thị giác máy tính, cả học có giám sát và không giám sát đều đóng vai trò quan trọng. Phương pháp phù hợp phụ thuộc vào loại dữ liệu bạn có, liệu nó có nhãn hay không, cũng như vấn đề bạn đang cố gắng giải quyết và nhu cầu triển khai của bạn.

Nếu mục tiêu của bạn là độ chính xác cao và các đầu ra được xác định rõ ràng, machine learning có giám sát thường là lựa chọn tốt hơn. Nếu bạn đang khám phá dữ liệu hoặc làm việc mà không có nhãn, học không giám sát có thể phù hợp hơn.

Bạn muốn biết thêm về AI? Hãy xem cộng đồngkho lưu trữ GitHub của chúng tôi. Khám phá các trang giải pháp của chúng tôi để tìm hiểu về AI trong robotthị giác máy tính trong nông nghiệp. Khám phá các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng với thị giác máy tính ngay hôm nay!

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning