Các điểm nhấn chính từ Ultralytics tại CVPR 2025
Cùng chúng tôi điểm lại trải nghiệm của Ultralytics tại CVPR 2025, từ các điểm nhấn tại gian hàng đến các trường hợp sử dụng thị giác máy tính thực tế và những khoảnh khắc đáng nhớ tại Nashville.

Tuần trước, từ ngày 11 đến ngày 15 tháng 6, đội ngũ Ultralytics đã có mặt tại Nashville, Tennessee để tham dự CVPR 2025 - Hội nghị IEEE/CVF về Thị giác máy tính và Nhận dạng mẫu. Đây là một trong những sự kiện thường niên quan trọng trong lĩnh vực nghiên cứu thị giác máy tính và AI.
Được tổ chức tại Music City Center, hội nghị năm nay đã quy tụ hơn 12.000 người tham dự từ khắp nơi trên thế giới. Từ các nhà nghiên cứu học thuật và kỹ sư cho đến các nhà lãnh đạo ngành và nhà phát triển, sự kiện đã thu hút đông đảo những người đang nỗ lực thúc đẩy giới hạn của Vision AI.
Đặc biệt, CVPR 2025 đã giới thiệu các nghiên cứu đột phá và các thảo luận xung quanh mọi chủ đề, từ deep learning trong thị giác máy tính và multimodal learning đến các model generative AI, foundation models và các ứng dụng thực tế như lái xe tự hành và hiểu bối cảnh 3D.

Hình 1. CVPR 2025 tại Nashville, Tennessee.
Đối với Ultralytics, tuần lễ tại CVPR 2025 tập trung vào việc kết nối với cộng đồng thị giác máy tính, chia sẻ các bản demo và tìm hiểu cách các Ultralytics YOLO models đang được sử dụng trong các ngành công nghiệp. Tại Gian hàng 1512, chúng tôi đã giới thiệu các Vision AI solutions mới nhất, trò chuyện với hàng trăm khách tham quan về các trường hợp sử dụng thực tế và trực tiếp chứng kiến cách công việc của chúng tôi thúc đẩy đổi mới trong các lĩnh vực như robotics, bán lẻ, nghiên cứu và hơn thế nữa.
Hãy cùng nhìn lại một số khoảnh khắc yêu thích của chúng tôi từ sự kiện, nêu bật những bài học chính, các cuộc trò chuyện và kết nối cộng đồng.
Link to this sectionNhìn lại CVPR Nashville 2025#
CVPR được giới thiệu lần đầu vào năm 1983 và chính thức được IEEE hỗ trợ vào năm 1985. Qua nhiều năm, hội nghị đã phát triển thành một trong những sự kiện có ảnh hưởng nhất trong lĩnh vực thị giác máy tính và nhận dạng mẫu, quy tụ các nhà nghiên cứu, kỹ sư và nhà đổi mới trên toàn thế giới. Kể từ năm 2012, hội nghị được đồng tài trợ bởi Computer Vision Foundation (CVF), một tổ chức phi lợi nhuận hỗ trợ truy cập mở cho nghiên cứu thị giác máy tính và đóng vai trò quan trọng trong việc tổ chức sự kiện.
Được tổ chức hàng năm, CVPR đã trở nên nổi tiếng nhờ chiều sâu kỹ thuật và khả năng định hình hướng đi cho toàn bộ lĩnh vực, từ những bước đột phá ban đầu trong nhận dạng đối tượng đến những tiến bộ ngày nay về Vision AI và deep learning. Phiên bản năm nay đã nhận được hơn 13.000 bài báo gửi đến, tăng 13% so với năm ngoái. Với tỷ lệ chấp nhận chỉ 22%, hội nghị tiếp tục truyền thống nêu bật các nghiên cứu có tác động cao.
Dưới đây là cái nhìn nhanh về một số chủ đề nghiên cứu chính nổi bật tại CVPR 2025:
- Hiểu bối cảnh 3D và neural rendering: Các nhà nghiên cứu đang khám phá cách tái tạo và biểu diễn thế giới ở không gian ba chiều sử dụng nhiều góc nhìn hoặc dữ liệu đầu vào từ cảm biến để nâng cao các ứng dụng trong robotics, thực tế tăng cường và mô phỏng.
- Tổng hợp hình ảnh và video sử dụng generative AI: Lĩnh vực này tập trung vào việc tạo ra hình ảnh chất lượng cao từ đầu vào tối thiểu, như câu lệnh văn bản hoặc bản phác thảo, để hỗ trợ các công cụ thế hệ tiếp theo cho truyền thông sáng tạo và hệ thống tương tác.
- Multimodal learning và vision-language models: Các model này kết hợp dữ liệu hình ảnh và ngôn ngữ để cải thiện khả năng hiểu, suy luận và giao tiếp, mở đường cho các hệ thống AI linh hoạt và tổng quát hơn.
Link to this sectionChuẩn bị tại Music City Center cho CVPR#
Trước khi hội nghị chính thức khai mạc, đội ngũ của chúng tôi đã đến Nashville để chuẩn bị mọi thứ cho CVPR 2025.
Chúng tôi đã dành cả ngày để thiết lập tại Music City Center, nơi Gian hàng 1512 trở thành cơ sở hoạt động chính trong ba ngày đầy ắp các bản demo, trò chuyện và xây dựng cộng đồng. Với thiết bị mang theo, chúng tôi đã mở kiện phần cứng, cấu hình các bản demo YOLO trực tiếp và sắp xếp cẩn thận để đảm bảo mọi thứ vận hành trơn tru trong môi trường expo nhịp độ nhanh.
Không gian dần lấp đầy bởi những người đang dỡ thiết bị, kiểm tra bản demo và lắp ráp gian hàng. Việc chứng kiến tất cả mọi thứ hoàn thiện đã nhắc nhở chúng tôi rằng CVPR thực sự mang tính toàn cầu và đầy tính hợp tác.
Sau một buổi chiều làm việc hiệu quả, đội ngũ đã thay đổi nhịp độ và lên đường khám phá trung tâm Nashville. Tất nhiên, họ đã dừng chân trên phố Broadway, nơi âm nhạc đồng quê tràn ra từ mọi quán bar và nhà hàng.
Một số thành viên trong đội đã mua ủng cao bồi (lần đầu tiên đối với vài người trong chúng tôi), và họ kết thúc buổi tối với một món đặc sản địa phương cổ điển: gà cay từ Hattie B’s. Đó là sự kết hợp hoàn hảo giữa công việc và vui chơi. Gian hàng đã sẵn sàng, và đội ngũ đã được nạp lại năng lượng để xem CVPR 2025 mang đến những gì.
Link to this sectionCác cuộc trò chuyện về nghiên cứu thị giác máy tính và AI#
Ngày đầu tiên của triển lãm bắt đầu với đội ngũ Ultralytics tại chỗ và sẵn sàng hoạt động. Nuvola Ladi, Quản lý Nội dung Kỹ thuật số của chúng tôi, Zinnia Pourdad, Quản lý Sự kiện của chúng tôi, và Francesco Mattioli, Kỹ sư Machine Learning của chúng tôi, đã có mặt tại Music City Center trước 9 giờ sáng. Với việc kiểm tra thiết lập cuối cùng đã hoàn tất và các bản demo đã được chuẩn bị, chúng tôi sẵn sàng chào đón những người tham dự ngay khi cửa mở.
Đến 10 giờ sáng, đám đông bắt đầu đổ vào và năng lượng trên sàn triển lãm lập tức tăng cao. Gian hàng của chúng tôi nhanh chóng chật kín khách, và các món quà lưu niệm Ultralytics, đặc biệt là túi tote và hình dán, đã hết sạch chỉ trong vài phút. Đó là một cách phá băng thú vị giúp bắt đầu các cuộc trò chuyện và thu hút mọi người.

Hình 2. Nuvola Ladi, Zinnia Pourdad, và Francesco Mattioli tại Gian hàng 1512.
Trong suốt cả ngày, chúng tôi đã có cơ hội trò chuyện với các nhà nghiên cứu, kỹ sư và nhà phát triển đang thực hiện nhiều dự án khác nhau. Có rất nhiều sự quan tâm đến các bản demo YOLO trực tiếp của chúng tôi, và chúng tôi đã nghe về các trường hợp sử dụng trong robotics, y tế, sản xuất, bán lẻ và hơn thế nữa. Thật truyền cảm hứng khi thấy các model của chúng tôi được sử dụng rộng rãi như thế nào, từ nghiên cứu học thuật sớm cho đến các hệ thống doanh nghiệp đã được triển khai.
Chúng tôi cũng có cơ hội kết nối lại với các cộng tác viên trong không gian AI, bao gồm các đội ngũ từ Intel OpenVINO và Sony Semiconductor Solutions. Việc chia sẻ không gian với các nhà đổi mới khác đã giúp củng cố mức độ hợp tác và phát triển nhanh chóng mà lĩnh vực Vision AI vẫn đang duy trì.
Vào cuối ngày, đội ngũ đã đến Printers Alley để thưởng thức nhạc đồng quê trực tiếp và thư giãn. Sau một ngày trò chuyện bận rộn và năng lượng đáng kinh ngạc trên sàn triển lãm, đó là cách hoàn hảo để khép lại ngày đầu tiên của chúng tôi tại CVPR 2025.

Hình 3. Đội ngũ đã có cơ hội khám phá Printers Alley.
Link to this sectionNgày thứ 2 tại hội nghị thị giác máy tính ở Nashville#
Ngày thứ hai của CVPR 2025 tiếp nối ngay nơi ngày đầu tiên kết thúc. Gian hàng 1512 vẫn sôi động suốt cả ngày, với những khách tham quan quay trở lại và những người mới đến để tìm hiểu thêm về các Ultralytics YOLO models của chúng tôi và chia sẻ công việc của riêng họ.
Ví dụ, một trong những khoảnh khắc đáng nhớ nhất trong ngày là khi Intel Robodog đến thăm. Việc nhìn thấy phần cứng tiên tiến kết hợp với các vision model thực tế đang hoạt động thực sự đã nắm bắt được tinh thần của sự kiện.

Hình 4. Intel Robodog đã ghé thăm đội ngũ tại Gian hàng 1512.
Cuối buổi tối, đội ngũ của chúng tôi đã tham dự buổi họp mặt nhà phát triển After.CVPR() do Intel tổ chức. Đó là một không gian thoải mái và hợp tác đầy ắp các kỹ sư, nhà nghiên cứu và nhà phát triển từ khắp hệ sinh thái AI.
Buổi họp mặt có các bản demo trực tiếp và những cuộc trò chuyện ý nghĩa kéo dài đến tận đêm khuya. Trong sự kiện, Francesco Mattioli đã trình bày một bản demo chung kết hợp giữa Ultralytics và OpenVINO, giới thiệu cách các model của chúng tôi có thể được tích hợp vào các pipeline inference hiệu quả.
Anh ấy đã trình bày cách các model như Ultralytics YOLO11 có thể được xuất sang định dạng OpenVINO để đạt được inference tối ưu và nhanh hơn trên phần cứng Intel. Bản demo làm nổi bật khả năng hỗ trợ cho central processing units (CPUs), graphics processing units (GPUs), và neural processing units (NPUs). Điều này thu hút sự quan tâm đáng kể từ các đội ngũ đang làm việc với Edge AI và các ứng dụng thời gian thực.

Hình 5. Một cái nhìn thoáng qua về Buổi họp mặt nhà phát triển After.CVPR().
Link to this sectionDeep learning trong các ứng dụng thị giác máy tính tại CVPR#
Ngay cả trong ngày cuối cùng của CVPR 2025, Music City Center vẫn nhộn nhịp với các hoạt động. Những người tham dự vẫn đang khám phá các gian hàng, có những cuộc trò chuyện sâu sắc và tận dụng tối đa thời gian của họ tại hội nghị.
Một trong những điểm nổi bật của ngày là việc xem các buổi trình bày poster - một phần cốt lõi trong cách nghiên cứu được chia sẻ tại CVPR. Không giống như các bài thuyết trình trên sân khấu truyền thống, các buổi trình bày poster mang tính không chính thức và tương tác hơn.
Mỗi nhà nghiên cứu dựng một tấm poster in lớn tóm tắt công việc của họ và đứng gần đó để giải thích, trả lời câu hỏi và thảo luận về kết quả nghiên cứu của họ với bất kỳ ai ghé qua. Đây là một cách tuyệt vời để tìm hiểu về nhiều chủ đề khác nhau trong một khoảng thời gian ngắn, và nó tạo không gian cho những cuộc trò chuyện thực sự giữa người tham dự và người thuyết trình.
Chúng tôi đã thấy nhiều loại poster khác nhau bao trùm mọi chủ đề từ vision-language models và hiểu bối cảnh 3D đến các ứng dụng thực tế của AI trong robotics và y tế. Các phiên họp đã cho chúng tôi cái nhìn gần hơn về những ý tưởng mới nhất đang được khám phá trong lĩnh vực này và cơ hội kết nối trực tiếp với những người đứng sau chúng.
Với sự kiện đi đến hồi kết, chúng tôi rời đi với cảm giác đầy động lực hơn bao giờ hết. Tuần lễ đã tràn ngập việc học hỏi, hợp tác và động lực thực sự trong Vision AI, và chúng tôi rất hào hứng để đưa những hiểu biết đó vào các bước tiếp theo.
Link to this sectionCác điểm chính cần lưu ý#
CVPR 2025 là một tuần tuyệt vời để học hỏi, chia sẻ và kết nối. Từ những nghiên cứu tiên tiến đến các bản demo thực tế và những cuộc trò chuyện tuyệt vời, hội nghị đã cho thấy Vision AI đang tiến triển nhanh chóng như thế nào và cộng đồng đứng sau nó thực sự hỗ trợ và có sức ảnh hưởng ra sao.
Thật truyền cảm hứng khi thấy các Ultralytics YOLO models hoạt động trong rất nhiều ứng dụng thực tế và nghiên cứu. Hơn hết thảy, CVPR 2025 đã làm rõ rằng thị giác máy tính là trọng tâm của đổi mới AI, với nhiều điều hơn nữa vẫn đang chờ đợi ở phía trước.
Hãy tham gia cộng đồng của chúng tôi và tìm hiểu về Vision AI trên kho lưu trữ GitHub của chúng tôi. Tìm hiểu về các đổi mới như AI trong bán lẻ và thị giác máy tính trong sản xuất trên các trang giải pháp của chúng tôi. Xem các gói cấp phép của chúng tôi và bắt đầu hành trình AI của bạn ngay hôm nay!






