Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Vai trò của machine learning và khai thác dữ liệu trong thị giác máy tính

Abirami Vina

5 phút đọc

27 tháng 9, 2024

Tìm hiểu cách máy học và khai thác dữ liệu hỗ trợ thị giác máy tính, thúc đẩy sự tiến bộ trong lĩnh vực chăm sóc sức khỏe, thương mại điện tử, xe tự lái và ra quyết định theo thời gian thực.

Trí tuệ nhân tạo (AI) là một công nghệ mạnh mẽ, tuyệt vời trong việc phân tích các loại dữ liệu khác nhau và học hỏi từ chúng theo thời gian. Ví dụ: thị giác máy tính, một nhánh của AI, tập trung vào việc hiểu dữ liệu trực quan. Một lĩnh vực quan trọng khác là học máy (ML), cùng với khai thác dữ liệu, đóng một vai trò lớn trong việc cải thiện các mô hình thị giác máy tính. Khai thác dữ liệu là tất cả về việc tìm kiếm các mẫu hữu ích trong bộ dữ liệu lớn, trong khi học máy sử dụng các mẫu này để đào tạo các mô hình AI để xử lý các tác vụ mà không cần hướng dẫn chi tiết.

Những công nghệ này đang trở nên phổ biến hơn trong các ngành như xe tự lái, tài chínhsản xuất vì chúng đã phát triển rất nhiều trong những năm gần đây. Trong bài viết này, chúng ta sẽ phân tích khai phá dữ liệu và machine learning là gì, chúng được sử dụng như thế nào trong thị giác máy tính và cách chúng phối hợp với nhau để thúc đẩy sự tiến bộ trong các lĩnh vực như chăm sóc sức khỏe. Hãy bắt đầu nào!

Machine learning là gì?

Học máy giúp máy móc có thể học theo cách tương tự như cách con người làm, sử dụng dữ liệu và thuật toán để xác định các mẫu và đưa ra quyết định với sự hướng dẫn tối thiểu của con người. Khi các hệ thống này tiếp xúc với dữ liệu theo thời gian, chúng dần dần đưa ra các dự đoán chính xác hơn.

Quy trình hoạt động bằng cách sử dụng các thuật toán để đưa ra dự đoán hoặc phân loại dựa trên dữ liệu đầu vào. Thuật toán trước tiên xác định các mẫu và đưa ra một phỏng đoán hoặc suy luận có cơ sở ban đầu. Để đánh giá độ chính xác, một hàm lỗi so sánh đầu ra của mô hình với các ví dụ đã biết và sau đó hệ thống điều chỉnh các tham số của nó để giảm thiểu mọi lỗi. Chu kỳ đánh giá và điều chỉnh này tiếp tục tự động cho đến khi mô hình đạt đến mức hiệu suất mong muốn.

Nhìn chung, có bốn loại học máy: học có giám sát, học không giám sát, học bán giám sát và học tăng cường. Hãy cùng xem xét từng loại:

  • Học có giám sát (Supervised learning): Các thuật toán học từ dữ liệu được gán nhãn để dự đoán đầu ra cho các đầu vào mới. Các hệ thống lọc thư rác trên các dịch vụ email sử dụng học có giám sát.
  • Học không giám sát (Unsupervised learning): Không giống như học có giám sát, phương pháp này hoạt động với dữ liệu chưa được gán nhãn. Thuật toán xác định các mẫu hoặc nhóm dữ liệu dựa trên sự tương đồng mà không cần bất kỳ hướng dẫn nào. Nó thường được sử dụng cho các tác vụ như phát hiện bất thường. 
  • Học bán giám sát (Semi-supervised learning): Phương pháp này kết hợp một lượng nhỏ dữ liệu được gán nhãn với một tập dữ liệu lớn hơn chưa được gán nhãn. Thuật toán học từ cả hai để cải thiện độ chính xác, làm cho nó hữu ích khi dữ liệu được gán nhãn khan hiếm hoặc tốn kém.
  • Học tăng cường: Ở đây, thuật toán học bằng cách tương tác với môi trường của nó và nhận phần thưởng hoặc hình phạt dựa trên các hành động của nó. Nó tiếp tục cải thiện bằng cách nhắm mục tiêu tối đa hóa phần thưởng và thường được sử dụng trong các lĩnh vực như robot học, trò chơi và xe tự lái.
__wf_reserved_inherit
Hình 1. Các loại học máy.

Khai phá dữ liệu (data mining) là gì?

Khai thác dữ liệu là quá trình khám phá và phân tích các tập dữ liệu lớn để tìm ra các mô hình, xu hướng ẩn và những thông tin chi tiết có giá trị mà không dễ nhận thấy ngay lập tức. Nó bao gồm việc chuyển đổi dữ liệu thô thành thông tin hữu ích bằng cách sử dụng kết hợp các kỹ thuật thống kê, học máy và các công cụ quản lý cơ sở dữ liệu để xác định các kết nối và mô hình trong dữ liệu.

Quy trình bắt đầu bằng cách thu thập dữ liệu từ các nguồn khác nhau, như cơ sở dữ liệu hoặc bảng tính, và sắp xếp nó thành một định dạng có cấu trúc. Sau đó, dữ liệu được làm sạch để loại bỏ mọi lỗi, sự không nhất quán hoặc chi tiết bị thiếu để đảm bảo tính chính xác. Khi dữ liệu đã sẵn sàng, các thuật toán tiên tiến và phương pháp thống kê được sử dụng để phân tích nó.

Dưới đây là một số kỹ thuật phổ biến nhất được sử dụng để phân tích dữ liệu:

  • Phân loại: Nhóm dữ liệu vào các danh mục được xác định trước dựa trên các mẫu đã xác định.
  • Phân cụm: Nhóm các điểm dữ liệu tương tự lại với nhau để xác định các nhóm tự nhiên trong dữ liệu.
  • Kết hợp (Association): Xác định mối quan hệ giữa các biến, chẳng hạn như tìm các mẫu mặt hàng thường được mua cùng nhau.

Các kỹ thuật này giúp trích xuất các mẫu và thông tin chi tiết có ý nghĩa từ dữ liệu. Các phát hiện sau đó được diễn giải và trình bày theo cách dễ hiểu và có thể hành động, biến dữ liệu thô thành thông tin chi tiết có giá trị có thể giúp bạn đưa ra quyết định sáng suốt.

__wf_reserved_inherit
Hình 2. Các bước liên quan đến khai thác dữ liệu.

Tìm hiểu các ứng dụng của học máy và khai thác dữ liệu

Có rất nhiều ứng dụng trong nhiều ngành công nghiệp, nơi học máy và khai thác dữ liệu có thể tạo ra sự khác biệt lớn. Để hiểu tác động của các công nghệ này, chúng ta sẽ sử dụng ngành bán lẻ làm ví dụ.

Học máy có thể đặc biệt hữu ích cho các nhà bán lẻ dựa vào doanh số bán hàng trực tuyến. Các doanh nghiệp lớn như eBay và Amazon đang sử dụng các công cụ học máy tích hợp trong toàn bộ chu kỳ bán hàng của họ. Một trong những cách chính mà các doanh nghiệp bán lẻ sử dụng nó là để đối sánh sản phẩm. Nó liên quan đến việc xác định và liên kết các mặt hàng giống hệt nhau trên các danh mục khác nhau, điều này hữu ích cho việc so sánh giá, tạo các trang sản phẩm hợp nhất và phát hiện các khoảng trống sản phẩm. Mặc dù đối sánh thủ công hoạt động tốt đối với các danh mục nhỏ, nhưng ML giúp có thể xử lý các danh mục lớn hơn nhiều một cách hiệu quả. Nó cũng tạo điều kiện cho các loại đối sánh sản phẩm khác nhau, như đối sánh chính xác, đối sánh gần đúng, đối sánh hình ảnh, đối sánh thuộc tính, đối sánh danh mục và đối sánh đa miền.

__wf_reserved_inherit
Hình 3. Các loại kết hợp sản phẩm.

Một ứng dụng thú vị của khai thác dữ liệu trong bán lẻ là hiểu hành vi của khách hàng, đặc biệt thông qua phân khúc khách hàng. Khách hàng có thể được nhóm dựa trên các đặc điểm chung, như nhân khẩu học, mô hình mua sắm, lịch sử mua hàng trước đây, v.v. Các nhà bán lẻ có thể sử dụng các nhóm này để tạo ra các chiến lược tiếp thị mới để tiếp cận người mua hiện tại và tương lai.

Nói về hành vi khách hàng, một ứng dụng quan trọng khác của khai thác dữ liệu trong ngành bán lẻ là phân tích tỷ lệ khách hàng rời bỏ (churn analysis), còn được gọi là sự hao hụt hoặc mất mát khách hàng. Các nhà bán lẻ có thể hiểu rõ hơn về loại khách hàng nào đang rời đi, lý do họ rời đi và cách cải thiện khả năng giữ chân khách hàng. Mặc dù một mức độ churn nhất định là không thể tránh khỏi, nhưng việc xác định các mẫu thông qua khai thác dữ liệu giúp các nhà bán lẻ có thể thực hiện các bước chủ động, như cung cấp các ưu đãi hoặc phiếu giảm giá đặc biệt, để giảm thiểu sự mất mát khách hàng.

__wf_reserved_inherit
Hình 4. Phân khúc khách hàng.

Mối liên hệ giữa ML, khai thác dữ liệu và thị giác máy tính

Thị giác máy tính thực chất là một tập hợp con của học máy, tập trung vào việc dạy máy tính diễn giải dữ liệu trực quan từ hình ảnhvideo. Trong khi đó, khai thác dữ liệu có thể hỗ trợ các ứng dụng thị giác máy tính bằng cách phân tích lượng lớn dữ liệu thô để xác định những hình ảnh phù hợp nhất cho huấn luyện mô hình. Điều này rất quan trọng vì nó giúp đảm bảo rằng mô hình học hỏi từ những ví dụ tốt nhất, giảm bớt dữ liệu không cần thiết và giúp mô hình tập trung vào những gì quan trọng. Kết quả là, khai thác dữ liệu giúp các mô hình thị giác máy tính hoạt động hiệu quả và chính xác hơn, cải thiện các tác vụ như phát hiện đối tượng, phân loại hình ảnhphân đoạn thể hiện.

Tìm hiểu các ứng dụng sử dụng ML, khai thác dữ liệu và thị giác máy tính

Để hiểu sự kết hợp của ML, khai thác dữ liệu và thị giác máy tính, hãy xem xét một ví dụ về ứng dụng trong lĩnh vực chăm sóc sức khỏe.

Học máy, khai thác dữ liệu và thị giác máy tính đang thúc đẩy những tiến bộ lớn trong chăm sóc sức khỏe. Các tổ chức y tế như Johns Hopkins Medicine ở Hoa Kỳ đang sử dụng các công nghệ này để phân tích hình ảnh y tế và phát hiện các bệnh và dị thường như khối u sớm. Các mô hình thị giác máy tính như Ultralytics YOLOv8 có thể được sử dụng để phân tích hình ảnh nhằm xác định bất kỳ sự bất thường nào, trong khi học máy có thể tìm thấy các mẫu trong hồ sơ bệnh nhân có thể chỉ ra các vấn đề sức khỏe tiềm ẩn. Sau đó, khai thác dữ liệu có thể can thiệp để tìm kiếm trong một lượng lớn dữ liệu liên quan để giúp tìm ra các phương pháp điều trị hiệu quả hoặc các phương pháp chữa bệnh có thể. Bằng cách kết hợp các công nghệ này, các chuyên gia chăm sóc sức khỏe có thể chẩn đoán các tình trạng bệnh chính xác hơn và phát triển các kế hoạch điều trị tốt hơn, cuối cùng là cải thiện kết quả điều trị cho bệnh nhân.

__wf_reserved_inherit
Hình 5. Sử dụng YOLOv8 để phát hiện khối u.

Những thách thức và định hướng tương lai

Mặc dù các ứng dụng sử dụng thị giác máy tính, khai thác dữ liệu và học máy mang lại nhiều lợi ích khác nhau, nhưng có một số hạn chế cần xem xét. Những đổi mới này thường cần một lượng lớn dữ liệu để hoạt động tốt và quyền riêng tư dữ liệu có thể là một mối lo ngại. Ví dụ: các hệ thống thị giác máy tính trong các cửa hàng bán lẻ có thể thu thập và xử lý dữ liệu của người tiêu dùng và điều quan trọng là người tiêu dùng phải được thông báo rằng dữ liệu của họ đang được thu thập. 

Ngoài các vấn đề về quyền riêng tư dữ liệu, độ phức tạp của các mô hình computer vision là một vấn đề khác. Có thể khó hiểu cách các mô hình này đưa ra một kết quả nhất định khi cố gắng đưa ra các quyết định sáng suốt. Bất chấp những thách thức này, ngày càng có nhiều biện pháp được đưa ra để làm cho các giải pháp AI có trách nhiệm hơn và liền mạch hơn. Ví dụ: các kỹ thuật như federated learning đang trở nên phổ biến hơn vì chúng cho phép phát triển AI đồng thời đảm bảo bảo vệ quyền riêng tư. 

Học liên kết là một phương pháp giúp các mô hình học hỏi từ dữ liệu trong khi vẫn giữ dữ liệu ở vị trí ban đầu. Thay vì thu thập tất cả dữ liệu vào một cơ sở dữ liệu trung tâm, mô hình được huấn luyện trực tiếp trên các thiết bị hoặc máy chủ riêng lẻ chứa dữ liệu. Sau đó, các thiết bị này chỉ gửi lại các bản cập nhật mô hình thay vì dữ liệu thực tế. Các bản cập nhật mô hình sau đó được xem xét để cải thiện mô hình tổng thể.

Những điều cần nhớ

Cả học máy và khai thác dữ liệu đều đóng một vai trò rất quan trọng trong thị giác máy tính. Chúng giúp phân tích lượng lớn dữ liệu trực quan, khám phá những hiểu biết quan trọng và cải thiện các lĩnh vực khác nhau như chăm sóc sức khỏe, mua sắm trực tuyến và xe tự lái. Mặc dù có những thách thức, chẳng hạn như bảo vệ quyền riêng tư và hiểu các mô hình phức tạp, các phương pháp mới như học liên kết đang giúp giải quyết những vấn đề này. Khi các công nghệ này tiếp tục phát triển, chúng có thể sẽ dẫn đến việc đưa ra quyết định tốt hơn và nhiều đổi mới hơn trong nhiều lĩnh vực, làm cho cuộc sống của chúng ta hiệu quả và kết nối hơn.

Bạn tò mò về AI? Hãy xem kho lưu trữ GitHub của chúng tôi để xem những đóng góp của chúng tôi cho AI và đừng quên tương tác với cộng đồng của chúng tôi. Khám phá cách chúng tôi đang định nghĩa lại các ngành như sản xuấtchăm sóc sức khỏe bằng công nghệ AI tiên tiến.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard