Dữ liệu tổng hợp trong thị giác máy tính là gì? Tổng quan

Abirami Vina

5 phút đọc

Ngày 4 tháng 7 năm 2025

Khám phá cách dữ liệu tổng hợp để đào tạo mô hình AI được sử dụng trong các ứng dụng thị giác máy tính trên nhiều ngành công nghiệp như chăm sóc sức khỏe và robot.

Dữ liệu luôn là yếu tố thúc đẩy trong các lĩnh vực như phân tích và trí tuệ nhân tạo (AI). Trên thực tế, cách chúng ta thu thập, tạo và sử dụng dữ liệu đang định hình tương lai của các hệ thống thông minh. Ví dụ, xe tự lái phụ thuộc vào hàng triệu hình ảnh được gắn nhãn và dữ liệu cảm biến, từ biển báo đường phố đến chuyển động của người đi bộ, để học cách điều hướng đường an toàn.

Một trong những loại dữ liệu quan trọng nhất thúc đẩy sự tiến bộ này, đặc biệt là trong các lĩnh vực như xe tự hành và an ninh, là dữ liệu trực quan như hình ảnh và video. 

Cụ thể, lĩnh vực AI cho phép máy móc diễn giải thông tin trực quan này được gọi là thị giác máy tính . Nó giúp các hệ thống hiểu và phân tích các đầu vào trực quan giống như con người, hỗ trợ các tác vụ như nhận dạng khuôn mặt, phát hiện biển báo giao thông và phân tích hình ảnh y tế. 

Tuy nhiên, việc thu thập các tập dữ liệu trực quan chất lượng cao, quy mô lớn từ thế giới thực có thể tốn thời gian, tốn kém và thường gây ra mối lo ngại về quyền riêng tư. Đó là lý do tại sao các nhà nghiên cứu đang tích cực khám phá khái niệm tận dụng dữ liệu tổng hợp. 

Dữ liệu tổng hợp đề cập đến hình ảnh được tạo ra một cách nhân tạo, mô phỏng chặt chẽ hình ảnh và video trong thế giới thực. Dữ liệu này được tạo ra bằng các kỹ thuật như mô hình 3D, mô phỏng máy tính và các phương pháp AI tạo sinh như Mạng đối nghịch tạo sinh (GAN) , học các mẫu từ dữ liệu thực để tạo ra các ví dụ mới thực tế.

Dữ liệu tổng hợp dự kiến sẽ sớm đóng vai trò quan trọng trong quá trình phát triển AI - Gartner dự đoán rằng đến năm 2030, dữ liệu tổng hợp sẽ trở nên thiết yếu hơn dữ liệu thực tế. Trong bài viết này, chúng ta sẽ khám phá dữ liệu tổng hợp là gì trong bối cảnh thị giác máy tính, cách tạo ra dữ liệu và nơi dữ liệu này được áp dụng trong các tình huống thực tế. Hãy bắt đầu nào!

Dữ liệu tổng hợp trong thị giác máy tính là gì?

Giả sử bạn muốn đào tạo một mô hình Vision AI để phát hiện các đối tượng trong nhiều môi trường và điều kiện khác nhau. Chỉ dựa vào dữ liệu thực tế có thể khó khăn và đôi khi có cảm giác hạn chế. 

Trong khi đó, dữ liệu tổng hợp có thể được sử dụng để tạo ra tập dữ liệu phù hợp, chứa các đối tượng trong nhiều điều kiện nhân tạo khác nhau. Sử dụng các công cụ như mô hình hóa và mô phỏng 3D , các nhà phát triển có thể tạo ra hình ảnh với khả năng kiểm soát chính xác các yếu tố như ánh sáng, góc độ và vị trí đối tượng. Điều này, đến lượt nó, cung cấp nhiều tính linh hoạt hơn cho việc đào tạo mô hình so với dữ liệu thực tế.

Dữ liệu tổng hợp đặc biệt hữu ích khi việc thu thập dữ liệu thực tế là khó khăn hoặc không thể. Ví dụ, việc đào tạo một mô hình để nhận dạng mọi người trong nhiều tư thế khác nhau, như chạy, cúi người hoặc nằm xuống, sẽ đòi hỏi phải chụp hàng nghìn bức ảnh ở nhiều bối cảnh, góc độ và điều kiện ánh sáng khác nhau. 

Mặt khác, với dữ liệu tổng hợp, các nhà phát triển có thể dễ dàng tạo ra những biến thể này với nhãn chính xác, tiết kiệm thời gian và công sức đồng thời cải thiện hiệu suất mô hình.

Hình 1. Một tập dữ liệu tổng hợp với nhiều tư thế con người và các biến thể ánh sáng khác nhau ( nguồn ).

Dữ liệu tổng hợp so với dữ liệu thực trong AI

Tiếp theo, chúng ta hãy xem xét kỹ hơn sự khác biệt giữa dữ liệu tổng hợp và dữ liệu thực. Cả hai đều có ưu và nhược điểm khi nói đến việc đào tạo các mô hình AI

Ví dụ, dữ liệu tổng hợp hữu ích khi dữ liệu thực khó thu thập, nhưng nó có thể không nắm bắt được mọi chi tiết nhỏ có trong cuộc sống thực. Đồng thời, dữ liệu thực có tính xác thực hơn, nhưng có thể khó tìm nguồn, tốn thời gian để dán nhãn và có thể không bao quát được mọi tình huống.

Bằng cách kết hợp dữ liệu tổng hợp và dữ liệu thực, các nhà phát triển có thể tận dụng tối đa cả hai thế giới. Sự cân bằng này giúp các mô hình AI học chính xác hơn, khái quát hóa tốt hơn trong các tình huống khác nhau và giảm thiểu sự thiên vị.

Hình 2. Dữ liệu tổng hợp so với dữ liệu thực trong AI. Hình ảnh của tác giả.

Một cái nhìn về việc tạo dữ liệu cho các mô hình thị giác máy tính

Từ việc xây dựng thế giới ảo bằng các công cụ 3D đến tạo hình ảnh bằng AI tạo hình, sau đây là một số phương pháp phổ biến được sử dụng để tạo dữ liệu đào tạo tổng hợp cho các mô hình thị giác máy tính:

  • Mô hình 3D : Các nhà phát triển sử dụng phần mềm 3D để tạo các đối tượng và cảnh kỹ thuật số. Điều này cho phép kiểm soát hoàn toàn các yếu tố như ánh sáng, góc máy ảnh và vị trí của đối tượng và hữu ích để tạo ra hình ảnh chân thực về con người, phương tiện và môi trường.

  • Mô phỏng : Những mô phỏng này tái tạo các tình huống thực tế, như giao thông hoặc môi trường nhà máy, bằng cách sử dụng các công cụ dựa trên vật lý. Mô phỏng hữu ích để tạo dữ liệu đào tạo an toàn trong các lĩnh vực như robot và xe tự lái.

  • Mạng đối nghịch tạo sinh : GAN là một loại mô hình học sâu được tạo thành từ hai mạng: một mạng tạo ra hình ảnh và một mạng đánh giá chúng. Cùng nhau, chúng tạo ra hình ảnh cực kỳ chân thực, chẳng hạn như khuôn mặt người hoặc chế độ xem phố, bằng cách học từ các ví dụ thực tế.

  • Tạo thủ tục : Kỹ thuật này sử dụng các quy tắc được xác định trước hoặc các mô hình toán học để tự động tạo ra các cấu trúc hình ảnh phức tạp như địa hình, tòa nhà hoặc kết cấu. Nó thường được sử dụng trong các nền tảng trò chơi và mô phỏng và có thể tạo ra các tập dữ liệu đa dạng, quy mô lớn với sự tham gia tối thiểu của con người.

  • Ngẫu nhiên hóa miền : Nó có thể thay đổi ngẫu nhiên những thứ như ánh sáng, màu sắc và hình dạng vật thể trong các cảnh tổng hợp. Mục tiêu đằng sau kỹ thuật này là giúp các mô hình tập trung vào những gì thực sự quan trọng, khiến chúng thích ứng hơn với môi trường thực tế.
Hình 3. Ví dụ về dữ liệu: (a) Dựa trên mô hình 3D, (b) cảnh nhiều đối tượng tổng hợp và (c) hình ảnh tập dữ liệu thực ( nguồn ).

Đào tạo mô hình AI tầm nhìn với dữ liệu tổng hợp

Bây giờ chúng ta đã thảo luận về một số phương pháp khác nhau được sử dụng để tạo dữ liệu tổng hợp, hãy cùng tìm hiểu cách sử dụng dữ liệu này để đào tạo các mô hình AI. 

Sau khi tạo, dữ liệu tổng hợp thường có thể được tích hợp trực tiếp vào đường ống đào tạo theo cùng cách như dữ liệu thực tế. Nó thường bao gồm các chú thích cần thiết, chẳng hạn như nhãn đối tượng, hộp giới hạn hoặc mặt nạ phân đoạn, nghĩa là nó có thể được sử dụng cho các tác vụ học có giám sát, trong đó các mô hình học từ các cặp đầu vào-đầu ra được gắn nhãn, mà không cần phải gắn nhãn thủ công.

Trong quá trình đào tạo, mô hình xử lý hình ảnh tổng hợp để học cách phát hiện các đặc điểm, nhận dạng các mẫu và phân loại các đối tượng. Dữ liệu này có thể được sử dụng để xây dựng phiên bản ban đầu của mô hình từ đầu hoặc để làm giàu cho một tập dữ liệu hiện có, giúp cải thiện hiệu suất của mô hình.

Trong nhiều quy trình làm việc, dữ liệu tổng hợp cũng được sử dụng để tiền huấn luyện, cung cấp cho các mô hình kiến thức nền tảng rộng trước khi được tinh chỉnh với các ví dụ thực tế. Tương tự, dữ liệu tổng hợp được sử dụng để bổ sung cho các tập dữ liệu bằng cách đưa vào các biến thể được kiểm soát, chẳng hạn như các điều kiện ánh sáng, góc nhìn hoặc các lớp đối tượng hiếm khác nhau, nhằm cải thiện khả năng khái quát hóa và giảm hiện tượng quá khớp. 

Bằng cách kết hợp dữ liệu tổng hợp và dữ liệu thực, các nhóm có thể đào tạo các mô hình mạnh mẽ hơn, hoạt động tốt trong nhiều điều kiện khác nhau, đồng thời giảm sự phụ thuộc vào các nỗ lực thu thập dữ liệu thủ công tốn kém và mất thời gian.

Ứng dụng thực tế của dữ liệu tổng hợp trong thị giác máy tính

Khi dữ liệu tổng hợp trở nên thiết thực và dễ tiếp cận hơn, chúng ta bắt đầu thấy nó được áp dụng trong nhiều trường hợp sử dụng Vision AI trong thế giới thực. Hãy cùng khám phá một số ứng dụng có tác động lớn nhất trong thị giác máy tính nơi nó đang được sử dụng.

Sử dụng dữ liệu tổng hợp để phát hiện vật thể trong xe tự hành

Việc dạy xe tự lái lái xe an toàn đòi hỏi phải đào tạo các mô hình trong nhiều tình huống khác nhau, bao gồm các tình huống hiếm gặp hoặc nguy hiểm. Tuy nhiên, việc thu thập dữ liệu thực tế cho các trường hợp ngoại lệ này có thể là thách thức và đôi khi không an toàn. Dữ liệu tổng hợp có thể giúp tạo ra các cảnh trong đó các mô hình có thể học cách phát hiện các vật thể trong các tình huống khó khăn. Nó cũng có thể mô phỏng các cấu hình cảm biến khác nhau, điều này hữu ích vì không phải tất cả các xe tự lái đều sử dụng cùng một phần cứng.

Nền tảng DRIVE Sim của NVIDIA là một ví dụ tuyệt vời về điều này. Nó tạo ra dữ liệu tổng hợp chất lượng cao bằng cách sử dụng các mô hình 3D thực tế, môi trường ảo và mô phỏng cảm biến. Nó cũng có thể tạo ra hình ảnh của nhiều góc lái xe từ một hình ảnh duy nhất. Sử dụng dữ liệu tổng hợp như thế này giúp giảm nhu cầu thử nghiệm thực tế tốn kém trong khi vẫn cung cấp cho mô hình sự đa dạng cần thiết để học hiệu quả.

Hình 4. Tạo nhiều góc nhìn lái xe từ một hình ảnh ( nguồn ).

Giảm thiểu sự thiên vị trong AI hình ảnh y tế bằng dữ liệu tổng hợp

Các mô hình thị giác máy tính như Ultralytics YOLO11 hỗ trợ các tác vụ như phát hiện đối tượng và phân đoạn trường hợp có thể được đào tạo tùy chỉnh cho các ứng dụng hình ảnh y tế. Tuy nhiên, dữ liệu đào tạo trong thế giới thực thường chứa các sai lệch, vì nó có thể không đại diện đầy đủ cho bệnh nhân từ tất cả các nhóm nhân khẩu học.

Ví dụ, ung thư da ít được chẩn đoán ở những người có tông màu da sẫm hơn, dẫn đến dữ liệu hạn chế cho những nhóm dân số này. Sự mất cân bằng này có thể góp phần vào chẩn đoán sai và kết quả chăm sóc sức khỏe không đồng đều, đặc biệt là trong các lĩnh vực như mô bệnh học, chụp X-quang ngực và da liễu.

Hình ảnh tổng hợp có thể đóng vai trò trong việc thực hiện một bước để thu hẹp khoảng cách này trong dữ liệu. Bằng cách tạo ra các ví dụ bổ sung, đa dạng, chẳng hạn như các bất thường về mô khác nhau, nhiều tình trạng phổi và tông màu da với các loại tổn thương khác nhau, dữ liệu tổng hợp có thể giúp cải thiện hiệu suất mô hình trên các nhóm chưa được đại diện đầy đủ. 

Các nhà nghiên cứu hiện đang làm việc để phát triển và xác thực các tập dữ liệu tổng hợp để hỗ trợ các mục tiêu này. Họ cũng đang khám phá cách dữ liệu tổng hợp có thể được sử dụng để thử nghiệm các công cụ y tế và chiến lược điều trị mà không cần dựa vào hồ sơ bệnh nhân thực tế, giúp đẩy nhanh nghiên cứu trong khi vẫn bảo vệ quyền riêng tư của bệnh nhân. Thông qua công việc này, dữ liệu tổng hợp đang mở đường cho các hệ thống AI y tế toàn diện, chính xác và có đạo đức hơn.

Phát triển AI nông nghiệp với dữ liệu tổng hợp cho canh tác chính xác

Xây dựng hệ thống AI Vision cho các ứng dụng nông nghiệp phụ thuộc vào khả năng tiếp cận lượng lớn dữ liệu được gắn nhãn. Tuy nhiên, việc thu thập và gắn nhãn hình ảnh về cây trồng, bệnh tật và điều kiện đồng ruộng diễn ra chậm, tốn kém và thường bị hạn chế bởi các yếu tố như thời tiết, mùa vụ hoặc mức độ khó khăn khi tiếp cận một số khu vực nhất định. 

Những thách thức này khiến việc đào tạo các mô hình thị giác máy tính để xử lý các nhiệm vụ như phát hiện bệnh thực vật, theo dõi mùa màng hoặc dự đoán năng suất trở nên khó khăn. Đó là lúc dữ liệu tổng hợp có thể giúp ích - bằng cách mô phỏng các môi trường canh tác khác nhau để tạo ra các ví dụ đào tạo hữu ích.

Hình 5. Sử dụng hình ảnh tổng hợp để cải thiện khả năng phát hiện bệnh ( nguồn ).

Những điểm chính

Sử dụng dữ liệu tổng hợp là một bước tiến quan trọng trong đào tạo mô hình AI, đặc biệt là đối với các hệ thống thị giác máy tính trong các lĩnh vực mà dữ liệu thực tế bị hạn chế hoặc khó có được. Thay vì chỉ dựa vào ảnh hoặc video thực tế, có thể tốn kém, mất thời gian hoặc gây ra mối lo ngại về quyền riêng tư, dữ liệu tổng hợp cho phép chúng ta tạo ra hình ảnh thực tế, có nhãn theo yêu cầu. 

Nó giúp việc đào tạo các mô hình Vision AI cho các nhiệm vụ như lái xe tự động, phát hiện bệnh tật hoặc theo dõi cây trồng trở nên dễ dàng hơn. Khi AI tiếp tục phát triển, dữ liệu tổng hợp sẽ đóng vai trò lớn hơn nữa trong việc thúc đẩy đổi mới và cải thiện khả năng tiếp cận trong các ngành.

Tìm hiểu thêm về AI trên kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng đang phát triển của chúng tôi. Khám phá tác động của các ứng dụng như AI trong xe tự hànhthị giác máy tính trong nông nghiệp . Khám phá các tùy chọn cấp phép của chúng tôi và hiện thực hóa các dự án Vision AI của bạn.

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard