Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Thị giác AI

Tìm hiểu hậu trường của Vision AI trong phát trực tuyến

Khám phá cách thị giác máy tính nâng cao các nền tảng phát trực tuyến với các đề xuất được cá nhân hóa và phân tích nội dung theo thời gian thực nhằm mang lại trải nghiệm người dùng tốt hơn.

ABAbirami Vina
3 min read
Vision AI trong phát trực tuyến

Bạn đã bao giờ tự hỏi làm thế nào các nền tảng phát trực tuyến có thể giúp bạn xem các chương trình yêu thích một cách dễ dàng như vậy chưa? Cách đây không lâu, lĩnh vực giải trí đã rất khác biệt. Lịch phát sóng truyền hình được cố định và khán giả thường chỉ xem những gì được phát. Các dịch vụ phát trực tuyến đã thay đổi mô hình này. Các khảo sát cho thấy thị trường phát trực tuyến video toàn cầu được định giá 106,83 tỷ USD vào năm 2023 và dự kiến sẽ đạt 865,85 tỷ USD vào năm 2034.

Trí tuệ nhân tạo (AI) đóng vai trò then chốt trong quá trình tiến hóa này. Cụ thể, chúng ta đang chứng kiến sự gia tăng của các cải tiến về thị giác máy tính trong lĩnh vực này. Thị giác máy tính AI cho phép các nền tảng phát trực tuyến hiểu và diễn giải nội dung video bằng cách phân tích các khung hình và nhận dạng các mẫu.

Bằng cách xử lý dữ liệu hình ảnh, thị giác máy tính giúp các nền tảng tạo ra các đề xuất thông minh hơn, cải thiện việc tổ chức nội dung và thậm chí nâng cao các tính năng tương tác. Trong bài viết này, chúng ta sẽ khám phá cách thị giác máy tính giúp các nền tảng phát trực tuyến cải thiện việc phân phối nội dung, tinh chỉnh mức độ tương tác của người dùng và đơn giản hóa việc khám phá nội dung. Hãy cùng bắt đầu nào!

Thị trường phát trực tuyến video toàn cầu

Hình 1. Thị trường phát trực tuyến video toàn cầu.

Link to this sectionKhám phá thị giác máy tính và các nền tảng phát trực tuyến#

Đối với các nền tảng phát trực tuyến, thị giác máy tính có thể giúp chia nhỏ video thành các khung hình riêng lẻ và phân tích chúng bằng các model như Ultralytics YOLO11. YOLO11 có thể được huấn luyện tùy chỉnh trên các tập dữ liệu lớn gồm các ví dụ đã được dán nhãn. Các ví dụ được dán nhãn là các hình ảnh hoặc khung hình video được gắn thẻ với các chi tiết như đối tượng chứa trong đó, các hành động đang diễn ra hoặc loại cảnh. Điều này giúp model học cách nhận biết các mẫu tương tự. Các model này có thể phát hiện đối tượng, phân loại cảnh và nhận dạng các mẫu trong thời gian thực, cung cấp những thông tin chi tiết có giá trị về nội dung.

Để hiểu rõ hơn cách thức hoạt động này, hãy xem qua một số ví dụ về cách thị giác máy tính được áp dụng trong các nền tảng phát trực tuyến nhằm tối ưu hóa trải nghiệm người dùng và giúp nội dung dễ tiếp cận hơn.

Link to this sectionNhận dạng cảnh để đưa ra các đề xuất được cá nhân hóa#

Nhận dạng cảnh là một kỹ thuật thị giác máy tính giúp phân loại hình ảnh hoặc khung hình video dựa trên nội dung và chủ đề hình ảnh của chúng. Có thể coi đây là một dạng chuyên biệt của phân loại hình ảnh, nơi trọng tâm là xác định bối cảnh hoặc bầu không khí tổng thể của một cảnh thay vì các đối tượng riêng lẻ.

Ví dụ, một hệ thống nhận dạng cảnh có thể nhóm các cảnh thành các danh mục như "phòng ngủ phụ", "lối đi trong rừng" hoặc "bờ biển đá" bằng cách phân tích các đặc điểm như màu sắc, kết cấu, ánh sáng và đối tượng. Nhận dạng cảnh cho phép các nền tảng phát trực tuyến gắn thẻ và tổ chức nội dung một cách hiệu quả.

Phân loại cảnh sử dụng AI

Hình 2. Phân loại các cảnh bằng AI.

Nó đóng vai trò chính trong các đề xuất được cá nhân hóa. Nếu người dùng thường xuyên xem nội dung có bối cảnh ngoài trời yên bình như "bờ biển đầy nắng" hoặc không gian nội thất thời thượng như "nhà bếp sành điệu", nền tảng có thể đề xuất các chương trình hoặc bộ phim có hình ảnh tương tự. Nhận dạng cảnh đơn giản hóa việc khám phá nội dung và mang đến cho người dùng các đề xuất phù hợp với sở thích xem của họ.

Link to this sectionTạo hình ảnh và hình thu nhỏ (thumbnail)#

Tạo hình ảnh và hình thu nhỏ là quy trình tạo bản xem trước trực quan cho video nhằm thu hút người xem và làm nổi bật những khoảnh khắc chính. AI và thị giác máy tính có thể tự động hóa quy trình này để đảm bảo hình thu nhỏ có liên quan và bắt mắt.

Quy trình này hoạt động như sau:

  • Phân tích khung hình: Hệ thống thị giác máy tính có thể bắt đầu bằng việc quét hàng ngàn khung hình video để xác định những khoảnh khắc nổi bật. Đó có thể là biểu cảm cảm xúc, các hành động chính hoặc các cảnh ấn tượng về mặt hình ảnh đại diện tốt nhất cho nội dung video.
  • Phân tích chuyển động: Sau khi các khung hình tiềm năng được chọn, AI thị giác có thể được sử dụng để kiểm tra xem chúng có sắc nét và không bị mờ hay không, giúp tăng chất lượng hình ảnh tổng thể của hình thu nhỏ.
  • Phát hiện đối tượng và Phân tích cảnh: Sử dụng các model như YOLO11 (hỗ trợ các tác vụ thị giác máy tính như phát hiện đối tượng và phân đoạn cá thể), hệ thống có thể phát hiện các yếu tố quan trọng trong khung hình, chẳng hạn như đối tượng, nhân vật hoặc bối cảnh. Bước này xác nhận lại hình thu nhỏ phản ánh chính xác bản chất của video.
  • Tinh chỉnh hình ảnh: Các khung hình đã chọn sau đó được tinh chỉnh bằng cách xem xét các yếu tố như góc camera, ánh sáng và bố cục.
  • Cá nhân hóa: Cuối cùng, các thuật toán học máy có thể được sử dụng để cá nhân hóa các hình thu nhỏ dựa trên sở thích và lịch sử xem của người dùng. Làm như vậy sẽ tùy chỉnh hình ảnh theo thị hiếu cá nhân, khiến chúng dễ thu hút sự chú ý và thúc đẩy tương tác hơn.

Một ví dụ điển hình về ứng dụng thực tế tương tự là việc Netflix sử dụng thị giác máy tính để tự động tạo hình thu nhỏ (thumbnail). Bằng cách phân tích các khung hình để phát hiện cảm xúc, bối cảnh và các chi tiết điện ảnh, Netflix tạo ra các hình thu nhỏ phù hợp với sở thích của từng người xem. Ví dụ, người dùng yêu thích phim hài lãng mạn có thể thấy hình thu nhỏ làm nổi bật một khoảnh khắc nhẹ nhàng, trong khi người hâm mộ phim hành động có thể được hiển thị một cảnh quay cường độ cao và đầy năng lượng.

Hình thu nhỏ của chương trình truyền hình được tùy chỉnh để phù hợp với sở thích của người xem

Hình 3. Hình thu nhỏ của chương trình truyền hình có thể được tùy chỉnh để phù hợp với sở thích của người xem.

Link to this sectionXem trước nội dung tự động#

Khi bạn cuộn qua một nền tảng phát trực tuyến, các bản xem trước ngắn, bắt mắt mà bạn thấy không phải là ngẫu nhiên. Chúng được tạo ra một cách cẩn thận bằng cách sử dụng các công nghệ như thị giác máy tính để thu hút sự chú ý và làm nổi bật những khoảnh khắc hấp dẫn nhất của video. Sau khi những khoảnh khắc hay nhất được chọn, chúng sẽ được ghép lại thành một bản xem trước mượt mà và hấp dẫn.

Quy trình đằng sau việc chọn những khoảnh khắc đó bao gồm một số bước chính:

  • Phân đoạn cảnh: Video được chia thành các phần nhỏ hơn dựa trên các chuyển đổi tự nhiên, chẳng hạn như thay đổi về ánh sáng, góc camera hoặc hình ảnh.
  • Phát hiện chuyển động: Những khoảnh khắc năng động, đầy hành động được xác định để đảm bảo bản xem trước thu hút sự chú ý.
  • Model nổi bật (Saliency models): Các đặc điểm hình ảnh như màu sắc, độ sáng và độ tương phản được phân tích để xác định các phần bắt mắt nhất của một cảnh.
  • Phân tích biểu cảm khuôn mặt: Những khoảnh khắc với biểu cảm cảm xúc mạnh mẽ được chọn để tạo ra sự kết nối sâu sắc hơn với người xem.

Link to this sectionPhân loại và gắn thẻ nội dung#

Khả năng duyệt phim theo thể loại, tâm trạng hoặc chủ đề cụ thể dựa trên việc phân loại và gắn thẻ nội dung chính xác. Các nền tảng phát trực tuyến phổ biến sử dụng thị giác máy tính để tự động hóa quy trình này bằng cách phân tích video để tìm đối tượng, hành động, bối cảnh hoặc cảm xúc, sau đó gán các thẻ có liên quan. Điều này giúp tổ chức các thư viện phương tiện lớn và làm cho các đề xuất cá nhân hóa chính xác hơn bằng cách khớp nội dung với sở thích của người xem.

Các kỹ thuật AI thị giác như phân đoạn cảnh, phát hiện đối tượng và nhận dạng hoạt động có thể được sử dụng để gắn thẻ nội dung hiệu quả. Bằng cách xác định các yếu tố chính như đối tượng, tông màu cảm xúc và hành động, chúng tạo ra siêu dữ liệu chi tiết cho từng tựa phim. Siêu dữ liệu sau đó có thể được phân tích bằng học máy để tạo các danh mục giúp người dùng dễ dàng tìm thấy những gì họ đang tìm kiếm và cải thiện trải nghiệm duyệt web tổng thể.

Ví dụ về phân loại nội dung tự động cho các đề xuất phát trực tuyến

Hình 4. Một ví dụ về phân loại nội dung tự động cho các đề xuất phát trực tuyến được cá nhân hóa.

Link to this sectionLợi ích và thách thức của các nền tảng phát trực tuyến hỗ trợ AI#

Thị giác máy tính đang cải thiện các nền tảng phát trực tuyến với các tính năng sáng tạo giúp nâng cao trải nghiệm người dùng. Dưới đây là một số lợi ích độc đáo cần xem xét:

  • Chất lượng phát trực tuyến thích ứng: Thị giác máy tính có thể phân tích các cảnh video để phát hiện những khoảnh khắc chuyển động cao hoặc chi tiết cần chất lượng cao hơn. Những thông tin chi tiết này sau đó có thể được sử dụng để điều chỉnh chất lượng phát trực tuyến cho phù hợp với thiết bị và tốc độ internet của người dùng.
  • Giám sát hành vi thời gian thực: AI có thể được sử dụng để giám sát các luồng trực tiếp nhằm phát hiện vi phạm bản quyền trong thời gian thực. Nó cũng có thể xác định các hành động trái phép như thêm lớp phủ (ví dụ: logo hoặc quảng cáo) hoặc phát lại luồng sang các nền tảng khác.
  • Phân phối nội dung tiết kiệm năng lượng: Những hiểu biết từ AI thị giác có thể tối ưu hóa việc phân phối nội dung bằng cách phân tích nhu cầu và mô hình xem của người dùng. Lưu trữ nội dung phổ biến cục bộ và điều chỉnh chất lượng video giúp giảm mức sử dụng băng thông và tiêu thụ năng lượng, giúp việc phát trực tuyến trở nên bền vững hơn.

Mặc dù có nhiều ưu điểm, vẫn có một số hạn chế cần lưu ý khi triển khai các cải tiến này:

  • Nhu cầu tính toán cao: Các thuật toán thị giác máy tính đòi hỏi năng lượng tính toán lớn để xử lý và phân tích nội dung video, và nó có thể dẫn đến tăng chi phí và mức tiêu thụ năng lượng.

  • Mối lo ngại về quyền riêng tư dữ liệu: Vì thị giác máy tính dựa trên các tập dữ liệu lớn về tương tác và nội dung của người dùng, nó có thể làm dấy lên những lo ngại về quyền riêng tư và bảo mật dữ liệu.

  • Thiên kiến dữ liệu: Các model thị giác máy tính có thể phản ánh thiên kiến trong dữ liệu huấn luyện của chúng. Điều này có thể khiến chúng ưu tiên một số loại nội dung nhất định và làm giảm sự đa dạng trong các đề xuất.

Link to this sectionTương lai của AI trong các nền tảng phát trực tuyến#

Các cải tiến như điện toán biên (edge computing) và công nghệ 3D đang giúp định hình tương lai về cách chúng ta trải nghiệm giải trí. Điện toán biên có thể được sử dụng để xử lý video gần hơn với nơi chúng được phát trực tuyến. Nó giảm độ trễ và tiết kiệm băng thông, điều này đặc biệt quan trọng đối với phát trực tuyến trực tiếp và nội dung tương tác. Thời gian phản hồi nhanh hơn đồng nghĩa với những trải nghiệm mượt mà và hấp dẫn hơn cho người xem.

Đồng thời, công nghệ 3D đang tăng thêm chiều sâu và tính hiện thực cho các chương trình, bộ phim và tính năng tương tác. Những tiến bộ này cũng mở ra cánh cửa cho những khả năng mới như thực tế tăng cường (AR) và thực tế ảo (VR). Với các thiết bị như kính VR, người xem có thể bước vào các môi trường hoàn toàn nhập vai. Ranh giới giữa thế giới kỹ thuật số và vật lý có thể bị xóa nhòa để tạo ra một mức độ tương tác hoàn toàn mới.

Định hình lại hoạt động phát trực tuyến với các trải nghiệm tương tác dựa trên VR

Hình 5. Định hình lại phát trực tuyến với các trải nghiệm tương tác dựa trên VR.

Link to this sectionCác điểm chính cần lưu ý#

Thị giác máy tính đang định nghĩa lại các nền tảng phát trực tuyến bằng cách làm cho việc phân tích video trở nên thông minh hơn, phân loại nội dung nhanh hơn và đề xuất được cá nhân hóa hơn. Với các model như Ultralytics YOLO11, các nền tảng có thể phát hiện đối tượng và phân loại cảnh trong thời gian thực. Điều này giúp việc gắn thẻ nội dung trở nên dễ dàng hơn và cải thiện cách các chương trình và bộ phim được gợi ý.

Các nền tảng phát trực tuyến được tích hợp với AI thị giác mang đến những trải nghiệm hấp dẫn hơn cho người xem đồng thời đảm bảo các hoạt động nền tảng mượt mà và hiệu quả hơn. Khi công nghệ tiến bộ, các dịch vụ phát trực tuyến có khả năng sẽ trở nên tương tác nhiều hơn, cung cấp những trải nghiệm giải trí phong phú và nhập vai hơn.

Bạn tò mò về AI? Hãy truy cập kho lưu trữ GitHub của chúng tôi để khám phá thêm và kết nối với cộng đồng của chúng tôi. Khám phá các ứng dụng đa dạng của AI trong chăm sóc sức khỏethị giác máy tính trong nông nghiệp.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning