Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Back to customer stories
Dịch vụ Doanh nghiệp & Chuyên nghiệpPhân tích tài liệu & Nhận dạng biểu tượng

Prezent tăng độ chính xác phát hiện slide lên 34% với Ultralytics YOLO

Prezent tăng độ chính xác phát hiện slide lên 34% với Ultralytics YOLO logo

Khám phá cách Prezent tận dụng các mô hình Ultralytics YOLO để tự động hóa việc phát hiện phần tử slide, giảm thời gian xử lý xuống dưới 10 giây trong khi vẫn bảo toàn cấu trúc và thiết kế.

Prezent tăng độ chính xác phát hiện slide lên 34% với Ultralytics YOLO

Problem

Prezent cần một giải pháp Vision AI để tự động phát hiện cấu trúc slide vì các công cụ truyền thống chậm chạp, không đáng tin cậy và thường thất bại trong việc bảo toàn thiết kế.

Solution

Với các mô hình Ultralytics YOLO, Prezent đã cải thiện độ chính xác từ 65% lên 87%, cắt giảm thời gian đào tạo từ 3 ngày xuống còn 1 ngày và giảm thời gian xử lý slide xuống dưới 10 giây.

Các bài thuyết trình là chìa khóa cho sự giao tiếp rõ ràng trong các cuộc họp kinh doanh, nhưng việc thiết kế lại chúng sao cho vừa ấn tượng vừa nhiều thông tin có thể là một thử thách. Prezent sử dụng AI để phát hiện và hiểu các thành phần trên slide như tiêu đề, văn bản, hình ảnh và biểu đồ, đảm bảo các slide được thiết kế lại vẫn giữ được sự rõ ràng, thu hút về mặt thị giác và dễ theo dõi.

Khi thử nghiệm nhiều công cụ khác nhau để phát hiện các thành phần slide, Prezent nhận thấy rằng nhiều công cụ làm gián đoạn bố cục và hệ thống phân cấp thông tin, khiến các bài thuyết trình trở nên thiếu gắn kết. Bằng cách tích hợp các mô hình Ultralytics YOLO, Prezent hợp lý hóa quy trình, giúp việc phát hiện các thành phần slide nhanh hơn, mượt mà hơn và chuyên nghiệp hơn với nỗ lực tối thiểu.

Link to this sectionGiúp việc thiết kế lại slide nhanh hơn và thông minh hơn với AI#

Prezent giúp các giám đốc điều hành và các nhóm kinh doanh tạo ra các bài thuyết trình chuyên nghiệp, rõ ràng bằng cách tự động hóa quy trình thiết kế lại. Ban đầu, việc này dựa vào các mẫu thủ công và sức người, vốn chậm chạp và kém hiệu quả.

Để cải thiện hiệu quả, Prezent đã chuyển sang sử dụng AI và computer vision để tự động hóa việc định dạng slide trong khi vẫn giữ nguyên bố cục gốc. Bằng cách sử dụng các mô hình object detection, nền tảng của họ hiện có thể tự động phát hiện và sắp xếp nội dung slide cho một quy trình thiết kế lại nhanh chóng, liền mạch hơn với sự can thiệp tối thiểu từ người dùng. Nhờ đó, Prezent đảm bảo rằng các bài thuyết trình luôn rõ ràng, hấp dẫn về thị giác và dễ theo dõi.

Link to this sectionRào cản trong việc thiết kế lại slide bằng AI#

Một bài thuyết trình tuyệt vời không chỉ nằm ở thông tin - mà còn ở sự rõ ràng, cấu trúc và tác động. Tuy nhiên, việc thiết kế lại các slide thủ công để chúng trở nên hấp dẫn hơn đòi hỏi thời gian và công sức. Đối với các giám đốc điều hành và các nhóm kinh doanh, những người thường xuyên dựa vào các bài thuyết trình cho các cuộc họp, quy trình thiết kế lại chậm chạp và gây thất vọng là một thách thức lớn.

Prezent bắt đầu tự động hóa việc thiết kế lại slide, nhưng có một trở ngại chính - làm thế nào để phát hiện và sắp xếp lại các thành phần slide trong khi vẫn giữ mọi thứ đúng vị trí? Các công cụ truyền thống có thể trích xuất văn bản nhưng không nhận diện được cách sắp xếp các tiêu đề, hình ảnh và biểu đồ, thường làm gián đoạn bố cục.

Ban đầu, Prezent sử dụng các mô hình object detection mã nguồn mở, nhưng các phương pháp này có những hạn chế: độ chính xác thấp (60-65%), thời gian xử lý chậm và các bố cục vẫn cần chỉnh sửa thủ công. Để thực sự tự động hóa quy trình, Prezent cần một giải pháp Vision AI nhanh hơn, thông minh hơn có thể phát hiện chính xác các thành phần slide và thiết kế lại chúng mà không làm ảnh hưởng đến cấu trúc. Đó là lúc họ chuyển sang sử dụng computer vision và AI để làm cho quy trình trở nên liền mạch.

Link to this sectionGiải pháp Vision AI của Prezent cho việc phát hiện thành phần slide#

Để tự động hóa việc thiết kế lại slide trong khi vẫn giữ nguyên bố cục, Prezent đã tích hợp các mô hình Ultralytics YOLO vào nền tảng của mình. Các mô hình Ultralytics YOLO hỗ trợ nhiều computer vision tasks, bao gồm object detection. Các slide được chuyển đổi thành hình ảnh, và YOLO phát hiện các thành phần chính - tiêu đề, hộp văn bản, hình ảnh và biểu đồ - trong khi vẫn giữ nguyên bố cục ban đầu.

YOLO đóng một vai trò quan trọng trong việc trích xuất bố cục, giúp Prezent bảo toàn cấu trúc và hệ thống phân cấp của từng slide đồng thời cho phép thiết kế lại tự động, nhanh chóng. Bằng cách nhận diện cả văn bản và các yếu tố hình ảnh, YOLO giúp đảm bảo các bài thuyết trình duy trì được cả chức năng và thiết kế chỉn chu. Với độ chính xác cao và xử lý nhanh, YOLO giúp Prezent tự động hóa việc phát hiện các thành phần slide, giảm nhu cầu điều chỉnh thủ công.

Link to this sectionTại sao lại chọn các mô hình Ultralytics YOLO?#

Prezent chọn các mô hình Ultralytics YOLO vì chúng có thể được đào tạo nhanh hơn, chính xác hơn và có độ trễ thấp hơn so với các mô hình Vision AI khác. Prezent nhận thấy hầu hết các mô hình mất từ hai đến ba ngày để đào tạo, làm chậm quá trình lặp lại và cải tiến.

"Thông thường, việc đào tạo một mô hình machine learning tốn rất nhiều thời gian và bạn thường phải đợi hai đến ba ngày để nhận kết quả inference, rồi mới quyết định xem độ chính xác đã đủ tốt chưa. Nhưng với YOLO, chúng tôi có thể đào tạo mô hình chỉ trong một ngày, đưa ra quyết định nhanh chóng và học hỏi kết quả một cách nhanh chóng," theo chia sẻ của Giám đốc Khoa học Dữ liệu tại Prezent.

Với YOLO, độ chính xác của Prezent đã tăng từ 65% lên 87% và họ có thể nhanh chóng tinh chỉnh các mô hình và nâng cao hiệu suất. Ngoài ra, tốc độ inference nhanh của YOLO cho phép xử lý slide trong dưới 10 giây, đảm bảo tự động hóa theo thời gian thực và trải nghiệm người dùng liền mạch. Bằng cách tích hợp YOLO, Prezent đã tìm thấy một giải pháp đáng tin cậy, có khả năng mở rộng để thiết kế lại slide hiệu quả và chính xác.

Link to this sectionXử lý slide trong dưới 10 giây với YOLO#

Bằng cách tận dụng các mô hình Ultralytics YOLO, Prezent đã định nghĩa lại quy trình thiết kế lại slide của mình trở nên nhanh hơn, hiệu quả hơn và chính xác hơn. Khả năng tự động phát hiện và sắp xếp các thành phần slide đảm bảo rằng các bài thuyết trình duy trì được cấu trúc, sự rõ ràng và sức hấp dẫn thị giác ban đầu mà không cần sự can thiệp thủ công.

"Sử dụng Ultralytics YOLO, tốc độ xử lý cũng vượt trội hơn vì chúng tôi có thể cung cấp cho khách hàng các slide đã xử lý hoàn chỉnh trong dưới 10 giây. Thời gian đào tạo nhanh và độ trễ thấp là chìa khóa để hợp lý hóa quy trình làm việc và cải thiện chất lượng các bản thiết kế lại của chúng tôi," Giám đốc Khoa học Dữ liệu tại Prezent chia sẻ.

Với khả năng xử lý thời gian thực của YOLO, Prezent đã có thể tự động hóa hoàn toàn việc phát hiện bố cục slide, loại bỏ sự kém hiệu quả của việc thiết kế lại thủ công. Các giám đốc điều hành và các nhóm kinh doanh có thể tạo ra các bài thuyết trình chỉn chu, chuyên nghiệp ngay lập tức, cải thiện hiệu quả công việc và trải nghiệm người dùng. Bằng cách tích hợp computer vision và AI, Prezent đã xây dựng một giải pháp tự động, có khả năng mở rộng, giúp tăng cường cả năng suất lẫn chất lượng bài thuyết trình.

Link to this sectionHướng đi sắp tới của computer vision trong phân tích tài liệu#

Prezent mong muốn thấy các mô hình computer vision cải thiện khả năng xử lý các bố cục phức tạp hơn và cung cấp thông tin sâu sắc hơn về cấu trúc tài liệu. Điều này sẽ cho phép thiết kế lại slide một cách tinh tế và chính xác hơn.

Một cải tiến tiềm năng là khả năng nhóm các thành phần liên quan thành các danh mục phụ. Những thông tin sâu sắc như vậy sẽ giúp các mô hình Vision AI hiểu được hệ thống phân cấp và mối quan hệ giữa các thành phần trên slide. Kết quả là, các slide được thiết kế lại sẽ có cấu trúc tốt hơn, gắn kết về mặt thị giác và dễ theo dõi hơn.

Nhìn chung, Prezent tin rằng khi nhu cầu về tự động hóa và các giải pháp dựa trên AI ngày càng tăng, các mô hình computer vision sẽ tiếp tục phát triển để xử lý các tác vụ phức tạp hơn với độ chính xác và tốc độ cao hơn.

Bạn tò mò về việc Vision AI có thể cải thiện doanh nghiệp của bạn như thế nào? Hãy truy cập GitHub repository của chúng tôi để xem các giải pháp AI của Ultralytics cho nhiều ngành công nghiệp khác nhau, như computer vision in healthcaremanufacturing. Khám phá cách các mô hình YOLO và license options của chúng tôi có thể giúp bạn bắt đầu ngay hôm nay!

Our solution to your industry

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Các câu hỏi thường gặp

  • Các kho lưu trữ Ultralytics YOLO được phân phối theo Giấy phép AGPL-3.0 theo mặc định. Giấy phép được OSI phê duyệt này được thiết kế cho sinh viên, nhà nghiên cứu và những người đam mê, thúc đẩy sự cộng tác mở và yêu cầu bất kỳ phần mềm nào sử dụng các thành phần AGPL-3.0 cũng phải là mã nguồn mở. Mặc dù điều này đảm bảo tính minh bạch và thúc đẩy đổi mới, nhưng nó có thể không phù hợp với các trường hợp sử dụng thương mại.

    Nếu dự án của bạn liên quan đến việc nhúng phần mềm và các model AI của Ultralytics vào các sản phẩm hoặc dịch vụ thương mại và bạn muốn bỏ qua các yêu cầu mã nguồn mở của AGPL-3.0, thì Giấy phép Doanh nghiệp (Enterprise License) là lựa chọn lý tưởng.

    Lợi ích của Giấy phép Doanh nghiệp bao gồm:

    • Tính linh hoạt thương mại: Sửa đổi và nhúng mã nguồn và các model của Ultralytics YOLO vào các sản phẩm độc quyền mà không cần tuân thủ yêu cầu của AGPL-3.0 về việc mở mã nguồn dự án của bạn.
    • Phát triển độc quyền: Có toàn quyền tự do phát triển và phân phối các ứng dụng thương mại bao gồm mã và các model của Ultralytics YOLO.

    Để đảm bảo tích hợp liền mạch và tránh các hạn chế của AGPL-3.0, hãy yêu cầu Giấy phép Doanh nghiệp của Ultralytics bằng biểu mẫu được cung cấp. Nhóm của chúng tôi sẽ hỗ trợ bạn điều chỉnh giấy phép phù hợp với nhu cầu cụ thể của bạn.

  • Model bạn chọn phụ thuộc vào các yêu cầu của dự án, bao gồm hiệu suất, độ chính xác, mục tiêu triển khai và các ràng buộc về phần cứng. Đối với hầu hết các dự án mới, Ultralytics YOLO26 là điểm bắt đầu được khuyến nghị vì nó cung cấp các cải tiến mới nhất về tốc độ, độ chính xác, khả năng xuất và hỗ trợ đa tác vụ.

    Các dòng model YOLO trước đó vẫn có sẵn cho các nhóm có quy trình làm việc hiện có hoặc yêu cầu tương thích.

    Nếu bạn đang bắt đầu từ đầu, hãy chọn YOLO26 trước, sau đó so sánh các biến thể nhỏ hơn hoặc lớn hơn để tìm ra sự cân bằng phù hợp giữa tốc độ và độ chính xác cho môi trường triển khai của bạn.

  • Các model Ultralytics YOLO là một dòng các model thị giác máy tính cho các tác vụ như phát hiện đối tượng, phân đoạn, phân loại, ước tính tư thế và phát hiện đối tượng theo hướng. YOLO26 là phiên bản ổn định mới nhất và được khuyến nghị cho hầu hết các dự án mới. Các phiên bản YOLO trước đó vẫn có sẵn cho các nhóm có quy trình làm việc hiện có hoặc yêu cầu tương thích.

  • Các model Ultralytics YOLO là các kiến trúc thị giác máy tính được phát triển để phân tích dữ liệu trực quan từ hình ảnh và video. Các model này có thể được huấn luyện cho các tác vụ bao gồm phát hiện đối tượng, phân loại, ước tính tư thế, theo dõi, phân đoạn cá thể và phát hiện đối tượng theo hướng.

    Dòng model Ultralytics YOLO mới nhất là YOLO26, với các phiên bản YOLO trước đó có sẵn cho các quy trình làm việc hiện có.

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning