Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Khám phá những điểm nổi bật từ sự kiện thường niên của Ultralytics và sống lại trải nghiệm YOLO Vision hybrid. Chúng tôi sẽ giới thiệu về buổi ra mắt YOLO11 của Ultralytics, các hội thảo hấp dẫn và nhiều nội dung khác.
Vào ngày 27 tháng 9, Ultralytics đã tập hợp cộng đồng AI và thị giác máy tính cho sự kiện kết hợp thường niên thú vị của chúng tôi, YOLO Vision 2024 (YV24) . Được tổ chức tại Google for Startups Campus ở Madrid và phát trực tuyến trên toàn cầu, sự kiện này đã quy tụ các chuyên gia, nhà phát triển và những người đam mê để thảo luận về những tiến bộ mới nhất trong Vision AI, chẳng hạn như mô hình YOLO11 mới của Ultralytics . Sự kiện phát trực tiếp đã đạt hơn 5.400 lượt xem, với hơn 10.600 lượt hiển thị và 469,5 giờ xem, thu hút những người đổi mới trên toàn thế giới.
YV24 bắt đầu với sự chào đón nồng nhiệt từ người dẫn chương trình, Oisin Lunny , người nhấn mạnh tầm quan trọng của cộng đồng và sự kết nối khi nói rằng, "Tôi là người rất tin tưởng vào sức mạnh của những ý tưởng tuyệt vời và cộng đồng tuyệt vời , và những gì Ultralytics đã tạo ra với YOLO Vision chính là như vậy - một cộng đồng tuyệt vời gồm những con người tuyệt vời với những ý tưởng tuyệt vời."
Trong bài viết này, chúng tôi sẽ chỉ ra những điểm nổi bật chính từ YOLO Vision 2024, từ các cuộc thảo luận nhóm hấp dẫn đến các trường hợp sử dụng thực tế hấp dẫn của thị giác máy tính . Chúng tôi cũng sẽ khám phá các cuộc nói chuyện kỹ thuật từ AI biên đến tăng tốc phần cứng , cũng như các khoảnh khắc xây dựng mạng lưới và cộng đồng đã làm nên thành công của sự kiện. Cho dù bạn quan tâm đến các cải tiến AI, thông báo chính hay tương lai của Vision AI, bản tóm tắt sự kiện YOLO Vision 2024 này sẽ đề cập đến tất cả những thông tin cần thiết!
Ultralytics YOLO11 ra mắt tại YOLO Vision
Việc ra mắt sản phẩm đã được hé lộ trước YOLO Vision 2024 cuối cùng đã được tiết lộ với thông báo trong bài phát biểu quan trọng đầu tiên của Glenn Jocher , Nhà sáng lập kiêm Tổng giám đốc điều hành của Ultralytics. Glenn đã giới thiệu Ultralytics YOLO11 , đánh dấu thế hệ tiếp theo của các mô hình thị giác máy tính , đã được phát triển trong nhiều tháng. Thêm vào sự phấn khích của buổi ra mắt, Glenn sau đó đã được phỏng vấn trên The Ravit Show và chia sẻ những hiểu biết sâu sắc về quá trình phát triển của YOLO11 .
Trong bài phát biểu quan trọng của mình, Glenn cũng chia sẻ câu chuyện về hành trình của công ty, bắt đầu từ nền tảng vật lý hạt của ông và cách niềm đam mê tìm hiểu vũ trụ cuối cùng đã đưa ông đến với máy học và thị giác máy tính .
Hình 1. Ultralytics YOLO11 được Glenn Jocher chính thức công bố trên sân khấu tại YOLO Vision 2024.
Ông giải thích cách công trình ban đầu của ông trong lĩnh vực vật lý, nơi các nhà nghiên cứu phân tích tương tác hạt, tương tự như phát hiện vật thể trong thị giác máy tính. Sự tò mò và động lực làm việc với công nghệ tiên tiến cuối cùng đã dẫn đến việc tạo ra Ultralytics YOLOv5 . Trong suốt bài nói chuyện của mình, Glenn nhấn mạnh tầm quan trọng của sự hợp tác và đóng góp trong cộng đồng nguồn mở và cảm ơn các nhà phát triển trên toàn thế giới đã cung cấp phản hồi và giúp cải thiện YOLOv5 và Ultralytics YOLOv8 theo thời gian.
Sau đó, ông giới thiệu các tính năng chính của Ultralytics YOLO11 và giải thích rằng nó nhanh hơn, chính xác hơn và hiệu quả hơn so với các mô hình trước đó. Trên thực tế, YOLO11m sử dụng ít hơn 22% tham số so với YOLOv8m nhưng vẫn mang lại độ chính xác tốt hơn trên tập dữ liệu COCO , khiến YOLO11 trở nên hoàn hảo cho các ứng dụng thời gian thực, nơi tốc độ và độ chính xác là yếu tố cơ bản.
Glenn nhấn mạnh quy mô của buổi ra mắt bằng cách nói rằng, "Chúng tôi sẽ ra mắt tổng cộng 30 mô hình, 25 trong số đó là mã nguồn mở, với năm kích thước khác nhau cho năm nhiệm vụ khác nhau. Các nhiệm vụ là phân loại hình ảnh , phát hiện đối tượng , phân đoạn thể hiện , ước tính tư thế và hộp giới hạn định hướng ." Về phía doanh nghiệp, ông thông báo rằng vào tháng tới, các mô hình mạnh mẽ được đào tạo trên một tập dữ liệu độc quyền gồm 1 triệu hình ảnh sẽ có sẵn. Không cần phải nói, thông báo đã khởi động sự kiện một cách tốt đẹp, khiến những người tham dự háo hức tìm hiểu thêm về tiềm năng đổi mới của YOLO11 trên các lĩnh vực như sản xuất và xe tự lái .
Các cuộc thảo luận nhóm tại YOLO Vision: Hội nghị AI
Các cuộc thảo luận nhóm do Oisin Lunny điều hành tại YOLO Vision 2024 đã cung cấp nhiều hiểu biết sâu sắc về AI, thị giác máy tính và xây dựng cộng đồng.
Hội thảo tiếp theo giải quyết những thách thức mà phụ nữ phải đối mặt trong vai trò lãnh đạo AI , với các diễn giả: Giám đốc tăng trưởng của Ultralytics Paula Derrenger , cựu CPO và COO tại SaaS Bruna de Guimarães , Trưởng nhóm Latinas tại Tech Madrid Mariana Hernandez và Nhà sáng lập Dare to DataChristina Stathopoulous chia sẻ kinh nghiệm của họ, đồng thời thảo luận về tầm quan trọng của hoạt động cố vấn và nhu cầu phụ nữ phải chủ động thực hiện các bước để tìm kiếm vai trò lãnh đạo. Hernandez khuyên rằng, "Hãy chủ động, đừng chờ đợi mọi thứ xảy đến với bạn" và khuyến khích phụ nữ trong khán phòng khẳng định bản thân và chủ động theo đuổi các cơ hội. Hội thảo cũng thảo luận về giá trị của việc tạo ra môi trường làm việc hỗ trợ nhiều hơn.
Hình 2. Một nhóm thảo luận về phụ nữ trong lĩnh vực công nghệ, từ trái sang phải: Christina Stathopoulous, Paula Derrenger, Mariana Hernandez, Oisin Lunny, với Bruna de Guimarães tham gia từ xa.
Hội thảo cuối cùng khám phá cách xây dựng cộng đồng mạnh mẽ có thể thúc đẩy sự đổi mới trong AI. Burhan Qaddoumi , Harpreet Sahota và Bart Farrell thảo luận về các cách để thu hút khán giả kỹ thuật, cả trực tuyến và tại các sự kiện trực tiếp. Nhận định của Farrell, "Bạn phải gặp họ ở nơi họ đang ở", đồng cảm với tầm quan trọng của việc kết nối với các thành viên cộng đồng theo các điều khoản của họ để khuyến khích sự hợp tác và học tập chung.
Hình 3. Bảng thảo luận về xây dựng cộng đồng, từ trái sang phải: Harpreet Sahota, Burhan Qaddoumi, Bart Farrell và Oisin Lunny.
Ví dụ thực tế về những đổi mới AI tại YOLO Vision
Một số cuộc nói chuyện tại YV24 đã làm sáng tỏ cách các mô hình YOLO đang được áp dụng để giải quyết các thách thức trong thế giới thực trong nhiều ngành công nghiệp khác nhau. Jim Griffin , người dẫn chương trình podcast AI Master Group , đã nói về một dự án sử dụng các mô hình YOLOv8 để theo dõi chuyển động của cá mập dọc theo bờ biển California thông qua giám sát bằng máy bay không người lái . Hệ thống này cảnh báo cho nhân viên cứu hộ, chủ cửa hàng lướt sóng và phụ huynh, đảm bảo an toàn cho những người đi biển bằng cách phát hiện cá mập từ độ cao 200 feet so với mặt nước biển. Griffin giải thích rằng thách thức thực sự không phải là bản thân mô hình AI mà là các chuyến bay bằng máy bay không người lái và việc thu thập dữ liệu rộng rãi cần thiết để đào tạo mô hình .
Hình 4. Jim Griffin chia sẻ cách YOLOv8 được sử dụng để theo dõi chuyển động của cá mập dọc theo bờ biển California bằng máy bay không người lái.
Tương tự như vậy, David Scott từ The Main Branch đã thảo luận về việc mở rộng tầm nhìn máy tính từ phát hiện đối tượng đơn giản sang phân tích hành vi. Bài nói chuyện của ông nêu bật các ứng dụng trong thế giới thực như theo dõi hành vi của gia súc và xác định các hoạt động đáng ngờ trong các cửa hàng bán lẻ . Scott đã chia sẻ cách YOLOv8 có thể được sử dụng để theo dõi sức khỏe của gia súc bằng cách phân tích các hành vi cụ thể, chẳng hạn như ăn, uống và đi bộ.
Hơn nữa, một bài phát biểu quan trọng đặc biệt chân thành đến từ Ousman Umar của NASCO Feeding Minds , nơi ông chia sẻ cách tổ chức của mình đang thay đổi cuộc sống bằng cách cung cấp giáo dục CNTT tại Ghana. Quỹ của ông đã thành lập 17 trung tâm CNTT, đào tạo hơn 65.000 sinh viên, với mục tiêu tạo ra việc làm công nghệ địa phương để giúp giải quyết các vấn đề như nhập cư bất hợp pháp. Câu chuyện mạnh mẽ của Umar đã truyền tải cách giáo dục và công nghệ cùng nhau có thể thúc đẩy sự thay đổi lâu dài trong các cộng đồng chưa được phục vụ đầy đủ.
Các cuộc thảo luận công nghệ: Điểm nổi bật của diễn giả YOLO Vision
YV24 cũng có các bài nói chuyện khác nhau tập trung vào cách AI và phần cứng kết hợp với nhau để tạo ra những ý tưởng mới. Các chuyên gia từ các công ty như Intel , Sony và NVIDIA đã giải quyết vấn đề triển khai các mô hình YOLO trên các thiết bị biên và tối ưu hóa hiệu suất. Dmitriy Pastushenkov và Adrian Boguszewski từ Intel đã phác thảo cách phần cứng của họ hỗ trợ các mô hình YOLO trên NPU, CPU và GPU, trong khi Amir Servi và Wei Tang của Sony đã chia sẻ cách YOLO tích hợp với nền tảng AITRIOS để triển khai AI biên hiệu quả. Guy Dahan từ NVIDIA đã nói về việc sử dụng kiến trúc GPU của họ để cải thiện suy luận mô hình YOLO.
Hình 5. Guy Dahan nói về việc tối ưu hóa suy luận mô hình YOLO bằng cách sử dụng kiến trúc GPU của NVIDIA.
Các công ty khác như Qualcomm , Hugging Face và Lightning AI cũng giới thiệu cách nền tảng của họ giúp các nhà phát triển tích hợp và triển khai các mô hình YOLO dễ dàng hơn. Devang Aggarwal từ Qualcomm đã trình bày cách các mô hình như YOLOv8 có thể được tối ưu hóa cho các thiết bị Snapdragon thông qua Qualcomm AI Hub.
Tương tự như vậy, Pavel Lakubovskii từ Hugging Face đã mô tả cách các công cụ nguồn mở của họ cho phép tích hợp liền mạch các mô hình như YOLOv8 vào nhiều quy trình công việc khác nhau, trong khi Luca Antiga từ Lightning AI đã hướng dẫn chúng tôi cách các nhà phát triển có thể dễ dàng kết hợp các mô hình như YOLOv8 ở cấp độ mã để tạo nguyên mẫu và lặp lại nhanh hơn.
Một tuần ở Madrid: Các buổi giao lưu của YOLO Vision
Trong tuần dẫn đến YV24, nhóm Ultralytics đã tập trung tại Madrid để tham gia nhiều hội thảo, cuộc họp hợp tác và các hoạt động ngoài khuôn viên. Các hoạt động này không chỉ dừng lại ở công việc, mà còn nuôi dưỡng các mối quan hệ bền chặt hơn và tạo ra bầu không khí tích cực trước sự kiện. Kết thúc bằng một bữa tiệc sau lễ kỷ niệm, những người tham dự và diễn giả có cơ hội giao lưu, chia sẻ những thông tin quan trọng và khám phá các hoạt động hợp tác trong tương lai. Sự kết hợp giữa tinh thần đồng đội và tình đồng chí đã biến YV24 thành một sự kiện thành công về mặt chuyên môn và là một trải nghiệm đáng nhớ toàn diện.
Hình 6. Nhóm Ultralytics đang kỷ niệm một ngày tuyệt vời tại YOLO Vision 2024.
Những đổi mới về AI của YOLO Vision và những gì sắp tới
YV24 đã tập hợp sự đổi mới, hợp tác và cái nhìn về tương lai của thị giác máy tính. Với sự ra mắt của YOLO11, các hội thảo hấp dẫn và các cuộc thảo luận về phần cứng AI và các giải pháp biên, sự kiện tập trung vào cách Vision AI có thể tạo ra sự khác biệt và cách công nghệ đang thay đổi để theo kịp những tiến bộ trong AI. Sự kiện cũng tăng cường kết nối trong cộng đồng. Các chuyên gia và người đam mê đã chia sẻ ý tưởng và khám phá tiềm năng của thị giác máy tính và YOLO. Sự kiện kết thúc bằng một buổi đố vui, nơi áo hoodie Ultralytics được trao tặng, khiến mọi người háo hức mong đợi nhiều cải tiến hơn nữa như YOLO11 trong tương lai.