Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay

Điểm nổi bật chính từ Ultralytics tại CVPR 2025

Abirami Vina

3 phút đọc

18 tháng 6, 2025

Hãy cùng chúng tôi tóm tắt trải nghiệm của Ultralytics tại CVPR 2025, từ những điểm nổi bật của gian hàng đến các trường hợp sử dụng thị giác máy tính thực tế và những khoảnh khắc đáng nhớ ở Nashville.

Tuần trước, từ ngày 11 đến ngày 15 tháng 6, nhóm Ultralytics đã có mặt tại Nashville, Tennessee, cho CVPR 2025 - Hội nghị IEEE/CVF về Thị giác Máy tính và Nhận dạng Mẫu. Đây là một trong những sự kiện thường niên quan trọng trong lĩnh vực nghiên cứu thị giác máy tính và AI. 

Được tổ chức tại Music City Center, hội nghị năm nay đã quy tụ hơn 12.000 người tham dự từ khắp nơi trên thế giới. Từ các nhà nghiên cứu và kỹ sư học thuật đến các nhà lãnh đạo ngành và nhà phát triển, sự kiện này có rất nhiều người đang thúc đẩy ranh giới của Vision AI. 

Đặc biệt, CVPR 2025 giới thiệu các nghiên cứu và thảo luận tiên tiến về mọi thứ, từ học sâu trong thị giác máy tính và học đa phương thức đến các mô hình AI tạo sinh, mô hình nền tảng và các ứng dụng thực tế như lái xe tự động và hiểu cảnh 3D.

Hình 1. CVPR 2025 tại Nashville, Tennessee.

Đối với Ultralytics, tuần tại CVPR 2025 tập trung vào việc kết nối với cộng đồng thị giác máy tính, chia sẻ bản demo và tìm hiểu cách các mô hình Ultralytics YOLO của chúng tôi đang được sử dụng trong các ngành công nghiệp. Tại Gian hàng 1512, chúng tôi đã giới thiệu các giải pháp Vision AI mới nhất của mình, nói chuyện với hàng trăm khách tham quan về các trường hợp sử dụng thực tế và tận mắt chứng kiến cách công việc của chúng tôi thúc đẩy sự đổi mới trong các lĩnh vực như robot, bán lẻ, nghiên cứu và hơn thế nữa. 

Vậy hãy cùng xem một số khoảnh khắc yêu thích của chúng tôi từ sự kiện, làm nổi bật những điểm chính, các cuộc trò chuyện và kết nối cộng đồng. 

Một cái nhìn về CVPR Nashville 2025

CVPR lần đầu tiên được giới thiệu vào năm 1983 và chính thức được IEEE hỗ trợ vào năm 1985. Trong những năm qua, nó đã phát triển thành một trong những hội nghị có ảnh hưởng nhất trong lĩnh vực thị giác máy tính và nhận dạng mẫu, quy tụ các nhà nghiên cứu, kỹ sư và nhà đổi mới trên toàn thế giới. Kể từ năm 2012, nó đã được đồng tài trợ bởi Computer Vision Foundation (CVF), một tổ chức phi lợi nhuận hỗ trợ truy cập mở vào nghiên cứu thị giác máy tính và đóng một vai trò quan trọng trong việc tổ chức sự kiện. 

Được tổ chức hàng năm, CVPR đã trở nên nổi tiếng về chiều sâu kỹ thuật và giúp định hình hướng đi của toàn bộ lĩnh vực, từ những đột phá ban đầu trong nhận dạng đối tượng đến những tiến bộ ngày nay trong Vision AI và học sâu. Phiên bản năm nay đã nhận được hơn 13.000 bài nộp, tăng 13% so với năm ngoái. Với tỷ lệ chấp nhận chỉ 22%, hội nghị tiếp tục truyền thống làm nổi bật các nghiên cứu có tác động cao.

Đây là cái nhìn sơ lược về một số chủ đề nghiên cứu chính nổi bật tại CVPR 2025:

  • Hiểu cảnh 3D và kết xuất thần kinh: Các nhà nghiên cứu đang khám phá cách tái tạo và biểu diễn thế giới trong không gian ba chiều bằng cách sử dụng nhiều góc nhìn hoặc đầu vào cảm biến để thúc đẩy các ứng dụng trong lĩnh vực robot, thực tế tăng cường và mô phỏng.
  • Tổng hợp ảnh và video bằngAI tạo sinh: Lĩnh vực này tập trung vào việc tạo ra hình ảnh chất lượng cao từ đầu vào tối thiểu, chẳng hạn như lời nhắc bằng văn bản hoặc bản phác thảo, để cung cấp năng lượng cho các công cụ thế hệ tiếp theo cho phương tiện sáng tạo và hệ thống tương tác.
  • Học đa phương thức và mô hình ngôn ngữ-thị giác (Multimodal learning and vision-language models): Các mô hình này kết hợp dữ liệu thị giác và ngôn ngữ để cải thiện khả năng hiểu, suy luận và giao tiếp, mở đường cho các hệ thống AI tổng quát và dễ thích ứng hơn.

Thiết lập tại Music City Center cho CVPR

Trước khi hội nghị chính thức bắt đầu, nhóm của chúng tôi đã đến Nashville để chuẩn bị mọi thứ cho CVPR 2025. 

Chúng tôi đã dành cả ngày để thiết lập tại Music City Center, nơi Gian hàng 1512 trở thành trụ sở chính của chúng tôi trong ba ngày đầy ắp các buổi demo, trò chuyện và xây dựng cộng đồng. Với đầy đủ thiết bị, chúng tôi đã dỡ phần cứng, định cấu hình các bản demo YOLO trực tiếp và cẩn thận sắp xếp thiết lập của mình để đảm bảo mọi thứ sẽ chạy trơn tru trong môi trường triển lãm nhộn nhịp. 

Không gian dần dần chứa đầy những người dỡ đồ, thử nghiệm bản demo và lắp ráp gian hàng của họ. Chứng kiến tất cả những điều đó diễn ra cùng nhau khiến chúng tôi nhớ lại CVPR thực sự mang tính toàn cầu và hợp tác đến mức nào.

Sau một buổi chiều làm việc hiệu quả, cả nhóm đã chuyển hướng và đi khám phá trung tâm thành phố Nashville. Đương nhiên, họ đã dừng chân trên đường Broadway, nơi nhạc đồng quê sống động tràn ra từ mọi quán bar và nhà hàng. 

Một vài thành viên trong nhóm đã mua ủng cao bồi (lần đầu tiên đối với một số người trong chúng tôi), và họ kết thúc buổi tối với món gà cay đặc trưng của địa phương từ Hattie B's. Đó là sự kết hợp hoàn hảo giữa công việc và niềm vui. Gian hàng đã sẵn sàng, và cả đội đã nạp lại năng lượng để xem CVPR 2025 có gì.

Các cuộc trò chuyện về thị giác máy tính và nghiên cứu AI

Ngày đầu tiên của triển lãm bắt đầu với đội Ultralytics tại chỗ và sẵn sàng. Nuvola Ladi, Giám đốc Nội dung Kỹ thuật số của chúng tôi, Zinnia Pourdad, Quản lý Sự kiện của chúng tôi và Francesco Mattioli, Kỹ sư Học máy của chúng tôi, đã đến Trung tâm Music City vào lúc 9 giờ sáng. Với việc kiểm tra thiết lập cuối cùng đã hoàn tất và các bản demo đã được chuẩn bị, chúng tôi đã sẵn sàng chào đón những người tham dự ngay khi cửa mở.

Đến 10 giờ sáng, đám đông bắt đầu đổ vào, và năng lượng trên sàn triển lãm tăng lên ngay lập tức. Gian hàng của chúng tôi nhanh chóng chật kín khách tham quan, và hàng hóa Ultralytics của chúng tôi, đặc biệt là túi tote và nhãn dán, đã hết trong vòng vài phút. Đó là một công cụ phá băng thú vị, giúp bắt đầu các cuộc trò chuyện và thu hút mọi người.

Hình 2. Nuvola Ladi, Zinnia Pourdad, và Francesco Mattioli tại Gian hàng 1512.

​​Trong suốt cả ngày, chúng tôi đã có cơ hội nói chuyện với các nhà nghiên cứu, kỹ sư và nhà phát triển làm việc trên nhiều dự án khác nhau. Có rất nhiều sự quan tâm đến các bản demo YOLO trực tiếp của chúng tôi và chúng tôi đã nghe về các trường hợp sử dụng trong lĩnh vực robot, chăm sóc sức khỏe, sản xuất, bán lẻ và hơn thế nữa. Thật truyền cảm hứng khi thấy các mô hình của chúng tôi được sử dụng rộng rãi như thế nào, từ nghiên cứu học thuật ban đầu đến các hệ thống doanh nghiệp được triển khai.

Chúng tôi cũng có cơ hội kết nối lại với các cộng tác viên trong lĩnh vực AI, bao gồm các nhóm từ Intel OpenVINO và Sony Semiconductor Solutions. Việc chia sẻ không gian với những nhà đổi mới khác đã củng cố sự hợp tác và tốc độ phát triển của lĩnh vực Vision AI.

Vào cuối ngày, cả đội đã đến Printers Alley để thưởng thức nhạc đồng quê sống động và thư giãn. Sau một ngày bận rộn với những cuộc trò chuyện và năng lượng đáng kinh ngạc trên sàn, đó là một cách hoàn hảo để kết thúc ngày đầu tiên của chúng tôi tại CVPR 2025.

Hình 3. Nhóm đã có cơ hội khám phá Printers Alley.

Ngày thứ 2 tại hội nghị thị giác máy tính ở Nashville

Ngày thứ hai của CVPR 2025 tiếp tục ngay sau ngày đầu tiên. Gian hàng 1512 vẫn sôi động suốt cả ngày, với những khách quen và những người tham dự mới ghé thăm để tìm hiểu thêm về các mô hình Ultralytics YOLO của chúng tôi và chia sẻ công việc của riêng họ.

Ví dụ: một trong những khoảnh khắc đáng nhớ nhất trong ngày là khi Intel Robodog ghé thăm. Việc chứng kiến phần cứng tiên tiến kết hợp với các mô hình thị giác thực tế hoạt động thực sự đã nắm bắt được tinh thần của sự kiện.

Hình 4. Intel Robodog đã đến thăm đội tại Gian hàng 1512.

Cuối buổi tối, nhóm của chúng tôi đã tham dự After.CVPR() Developer Meetup, do Intel tổ chức. Đó là một không gian thoải mái và hợp tác, chứa đầy các kỹ sư, nhà nghiên cứu và nhà phát triển từ khắp hệ sinh thái AI. 

Buổi gặp mặt có các bản demo trực tiếp và các cuộc trò chuyện ý nghĩa kéo dài đến tận đêm khuya. Trong sự kiện, Francesco Mattioli đã trình bày một bản demo chung có sự góp mặt của Ultralytics và OpenVINO, giới thiệu cách các mô hình của chúng tôi có thể được tích hợp vào các quy trình suy luận hiệu quả. 

Ông trình bày cách các mô hình như Ultralytics YOLOv8 có thể được xuất sang định dạng OpenVINO để đạt được suy luận nhanh hơn, được tối ưu hóa trên phần cứng Intel. Bản demo làm nổi bật sự hỗ trợ cho bộ xử lý trung tâm (CPU), bộ xử lý đồ họa (GPU) và bộ xử lý thần kinh (NPU). Nó thu hút sự quan tâm đáng kể từ các nhóm làm việc trên edge AI và các ứng dụng thời gian thực.

Hình 5. Một thoáng nhìn về buổi gặp mặt nhà phát triển After.CVPR().

Học sâu trong các ứng dụng thị giác máy tính tại CVPR

Ngay cả vào ngày cuối cùng của CVPR 2025, Trung tâm Music City vẫn nhộn nhịp hoạt động. Những người tham dự vẫn đang khám phá các gian hàng, trò chuyện sâu sắc và tận dụng tối đa thời gian của họ tại hội nghị.

Một trong những điểm nổi bật của ngày hôm đó là xem các phiên poster - một phần cốt lõi của cách chia sẻ nghiên cứu tại CVPR. Không giống như các bài thuyết trình trên sân khấu truyền thống, các phiên poster mang tính không chính thức và tương tác hơn. 

Mỗi nhà nghiên cứu sẽ chuẩn bị một poster lớn tóm tắt công trình của họ và đứng gần đó để giải thích, trả lời câu hỏi và thảo luận về những phát hiện của họ với bất kỳ ai ghé thăm. Đây là một cách tuyệt vời để tìm hiểu về nhiều chủ đề khác nhau trong một khoảng thời gian ngắn, đồng thời tạo không gian cho các cuộc trò chuyện thực sự giữa người tham dự và người trình bày.

Chúng tôi đã thấy rất nhiều áp phích bao gồm mọi thứ, từ mô hình ngôn ngữ thị giác và hiểu cảnh 3D đến các ứng dụng AI thực tế trong lĩnh vực robot và chăm sóc sức khỏe. Các phiên họp đã cho chúng ta cái nhìn cận cảnh hơn về những ý tưởng mới nhất đang được khám phá trong lĩnh vực này và cơ hội kết nối trực tiếp với những người đứng sau chúng.

Khi sự kiện kết thúc, chúng tôi ra về với cảm giác được thúc đẩy hơn bao giờ hết. Tuần lễ này chứa đựng rất nhiều kiến thức, sự hợp tác và động lực thực sự trong AI thị giác, và chúng tôi rất vui mừng được đưa những hiểu biết sâu sắc đó vào những gì tiếp theo.

Những điều cần nhớ

CVPR 2025 là một tuần tuyệt vời để học hỏi, chia sẻ và kết nối. Từ các nghiên cứu tiên tiến đến các bản demo thực tế và những cuộc trò chuyện thú vị, hội nghị đã cho thấy Vision AI đang phát triển nhanh chóng như thế nào và cộng đồng đứng sau nó thực sự có sức ảnh hưởng và hỗ trợ đến đâu.

Thật thú vị khi thấy các mô hình Ultralytics YOLO hoạt động trong rất nhiều ứng dụng nghiên cứu và thực tế. Hơn bất cứ điều gì, CVPR 2025 đã làm rõ rằng thị giác máy tính là trọng tâm của đổi mới AI, với rất nhiều điều nữa vẫn còn ở phía trước.

Tham gia cộng đồng của chúng tôi và khám phá Vision AI trên kho lưu trữ GitHub của chúng tôi. Tìm hiểu về các cải tiến như AI trong lĩnh vực bán lẻthị giác máy tính trong sản xuất trên các trang giải pháp của chúng tôi. Xem các gói cấp phép của chúng tôi và bắt đầu hành trình AI của bạn ngay hôm nay!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí