Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Khám phá những điểm nổi bật từ sự kiện thường niên của Ultralytics và sống lại trải nghiệm kết hợp YOLO Vision. Chúng ta sẽ đề cập đến việc ra mắt YOLO11 của Ultralytics, các hội thảo hấp dẫn và nhiều hơn nữa.
Vào ngày 27 tháng 9, Ultralytics đã tập hợp cộng đồng AI và thị giác máy tính cho sự kiện kết hợp hàng năm thú vị của chúng tôi, YOLO Vision 2024 (YV24). Được tổ chức tại Google for Startups Campus ở Madrid và được phát trực tiếp trên toàn cầu, sự kiện đã tập hợp các chuyên gia, nhà phát triển và những người đam mê để thảo luận về những tiến bộ mới nhất trong Vision AI, chẳng hạn như mô hình Ultralytics YOLO11 mới. Luồng trực tiếp của sự kiện đã đạt hơn 5.400 lượt xem, với hơn 10.600 lượt hiển thị và 469,5 giờ xem, thu hút những nhà đổi mới trên khắp thế giới.
YV24 bắt đầu với lời chào đón nồng nhiệt từ người dẫn chương trình của chúng tôi, Oisin Lunny, người đã nhấn mạnh tầm quan trọng của cộng đồng và sự kết nối bằng cách nói: "Tôi là một người rất tin vào sức mạnh của những ý tưởng tuyệt vời và những cộng đồng tuyệt vời, và những gì Ultralytics đã tạo ra với YOLO Vision chính là điều đó - một cộng đồng tuyệt vời của những người tuyệt vời với những ý tưởng tuyệt vời."
Trong bài viết này, chúng ta sẽ chỉ ra những điểm nổi bật chính từ YOLO Vision 2024, từ các phiên thảo luận hấp dẫn đến những trường hợp sử dụng thị giác máy tính thực tế đầy thú vị. Chúng ta cũng sẽ khám phá các buổi nói chuyện kỹ thuật, từ AI biên đến tăng tốc phần cứng, cũng như các khoảnh khắc kết nối và xây dựng cộng đồng đã làm nên thành công của sự kiện. Cho dù bạn quan tâm đến những đổi mới về AI, các thông báo quan trọng hay tương lai của Vision AI, bài tóm tắt sự kiện YOLO Vision 2024 này sẽ bao gồm tất cả những thông tin cần thiết!
Trong bài phát biểu quan trọng của mình, Glenn cũng chia sẻ câu chuyện về hành trình của công ty, bắt đầu với nền tảng của ông trong lĩnh vực vật lý hạt và niềm đam mê của ông với việc tìm hiểu vũ trụ cuối cùng đã dẫn ông đến máy học và thị giác máy tính.
Hình 1. Ultralytics YOLO11 đã được Glenn Jocher chính thức công bố trên sân khấu tại YOLO Vision 2024.
Ông giải thích công việc ban đầu của mình trong lĩnh vực vật lý, nơi các nhà nghiên cứu phân tích sự tương tác của các hạt, tương tự như phát hiện đối tượng trong thị giác máy tính. Sự tò mò và động lực làm việc trên công nghệ tiên tiến cuối cùng đã dẫn đến việc tạo ra Ultralytics YOLOv5. Trong suốt buổi nói chuyện, Glenn nhấn mạnh tầm quan trọng của sự hợp tác và đóng góp trong cộng đồng mã nguồn mở và cảm ơn các nhà phát triển trên toàn thế giới đã cung cấp phản hồi và giúp cải thiện YOLOv5 và Ultralytics YOLOv8 theo thời gian.
Sau đó, ông giới thiệu các tính năng chính của Ultralytics YOLO11 và giải thích rằng nó nhanh hơn, chính xác hơn và hiệu quả hơn so với các mô hình trước đó. Trên thực tế, YOLO11m sử dụng ít hơn 22% tham số so với YOLOv8m nhưng mang lại độ chính xác tốt hơn trên tập dữ liệu COCO, khiến YOLO11 trở nên hoàn hảo cho các ứng dụng thời gian thực, nơi tốc độ và độ chính xác là nền tảng.
Glenn nhấn mạnh quy mô của việc ra mắt bằng cách nói: "Chúng tôi đang ra mắt tổng cộng 30 mô hình, 25 trong số đó là mã nguồn mở, với năm kích thước khác nhau cho năm tác vụ khác nhau. Các tác vụ là phân loại ảnh, phát hiện đối tượng, phân đoạn thể hiện, ước tính tư thế và hộp giới hạn theo hướng." Về phía doanh nghiệp, ông thông báo rằng vào tháng tới, các mô hình mạnh mẽ được huấn luyện trên bộ dữ liệu độc quyền gồm 1 triệu hình ảnh sẽ có sẵn. Không cần phải nói, thông báo đã khởi động sự kiện một cách tốt đẹp, khiến những người tham dự háo hức tìm hiểu thêm về tiềm năng của YOLO11 để đổi mới trong các lĩnh vực như sản xuất và xe tự lái.
Thảo luận nhóm tại YOLO Vision: Hội nghị AI
Các cuộc thảo luận nhóm, được điều phối bởi Oisin Lunny, tại YOLO Vision 2024 đã cung cấp một loạt các hiểu biết sâu sắc về AI, thị giác máy tính và xây dựng cộng đồng.
Hội thảo tiếp theo đề cập đến những thách thức mà phụ nữ phải đối mặt trong vai trò lãnh đạo AI, với các diễn giả: Giám đốc tăng trưởng của Ultralytics Paula Derrenger, cựu CPO và COO trong SaaS Bruna de Guimarães, Trưởng nhóm chi nhánh cho Latinas in Tech Madrid Mariana Hernandez, và Người sáng lập Dare to DataChristina Stathopoulous chia sẻ kinh nghiệm của họ, đồng thời thảo luận về tầm quan trọng của việc cố vấn và sự cần thiết của phụ nữ trong việc chủ động thực hiện các bước để tìm kiếm vai trò lãnh đạo. Hernandez khuyên, "Hãy chủ động, đừng chờ đợi mọi thứ xảy ra với bạn," và khuyến khích phụ nữ trong khán giả khẳng định bản thân và chủ động theo đuổi các cơ hội. Hội thảo cũng thảo luận về giá trị của việc tạo ra môi trường làm việc hỗ trợ hơn.
Hình 2. Một buổi thảo luận về phụ nữ trong lĩnh vực công nghệ, từ trái sang phải: Christina Stathopoulous, Paula Derrenger, Mariana Hernandez, Oisin Lunny, với Bruna de Guimarães tham gia từ xa.
Hội thảo cuối cùng đã khám phá cách xây dựng các cộng đồng vững mạnh có thể thúc đẩy sự đổi mới trong AI. Burhan Qaddoumi, Harpreet Sahota và Bart Farrell đã thảo luận về các cách để tương tác với khán giả kỹ thuật, cả trực tuyến và tại các sự kiện trực tiếp. Quan điểm của Farrell, "Bạn phải gặp họ ở nơi họ đang ở", nhấn mạnh tầm quan trọng của việc kết nối với các thành viên cộng đồng theo cách của họ để khuyến khích sự hợp tác và học hỏi lẫn nhau.
Hình 3. Một buổi thảo luận về xây dựng cộng đồng, từ trái sang phải: Harpreet Sahota, Burhan Qaddoumi, Bart Farrell và Oisin Lunny.
Các ví dụ thực tế về đổi mới AI tại YOLO Vision
Một số bài nói chuyện tại YV24 đã làm sáng tỏ cách các mô hình YOLO đang được áp dụng để giải quyết các thách thức thực tế trong nhiều ngành công nghiệp khác nhau. Jim Griffin, người dẫn chương trình podcast AI Master Group, đã nói về một dự án sử dụng các mô hình YOLOv8 để theo dõi sự di chuyển của cá mập dọc theo bờ biển California thông qua giám sát bằng máy bay không người lái. Hệ thống cảnh báo nhân viên cứu hộ, chủ cửa hàng lướt sóng và phụ huynh, đảm bảo an toàn cho người đi biển bằng cách phát hiện cá mập từ độ cao 200 feet so với mặt biển. Griffin giải thích rằng thách thức thực sự không phải là bản thân mô hình AI mà là các chuyến bay bằng máy bay không người lái và thu thập dữ liệu rộng rãi cần thiết để huấn luyện mô hình.
Hình 4. Jim Griffin chia sẻ cách YOLOv8 đang được sử dụng để theo dõi sự di chuyển của cá mập dọc theo bờ biển California bằng máy bay không người lái.
Hơn nữa, một bài phát biểu quan trọng đặc biệt cảm động đến từ Ousman Umar của NASCO Feeding Minds, nơi ông chia sẻ cách tổ chức của mình đang thay đổi cuộc sống bằng cách cung cấp giáo dục CNTT ở Ghana. Tổ chức của ông đã thành lập 17 trung tâm ICT, đào tạo hơn 65.000 sinh viên, với mục tiêu tạo ra việc làm công nghệ tại địa phương để giúp giải quyết các vấn đề như nhập cư bất hợp pháp. Câu chuyện mạnh mẽ của Umar đã truyền tải cách giáo dục và công nghệ cùng nhau có thể thúc đẩy sự thay đổi lâu dài trong các cộng đồng khó khăn.
Các buổi nói chuyện về công nghệ: Điểm nổi bật của diễn giả YOLO Vision
YV24 cũng giới thiệu các buổi nói chuyện khác nhau tập trung vào cách AI và phần cứng kết hợp với nhau để tạo ra những ý tưởng mới. Các chuyên gia từ các công ty như Intel, Sony và NVIDIA đã đề cập đến việc triển khai các mô hình YOLO trên các thiết bị biên (edge device) và tối ưu hóa hiệu suất. Dmitriy Pastushenkov và Adrian Boguszewski từ Intel đã trình bày cách phần cứng của họ hỗ trợ các mô hình YOLO trên NPU, CPU và GPU, trong khi Amir Servi và Wei Tang của Sony đã chia sẻ cách YOLO tích hợp với nền tảng AITRIOS để triển khai AI biên hiệu quả. Guy Dahan từ NVIDIA đã nói về việc sử dụng kiến trúc GPU của họ để cải thiện quá trình suy luận (inference) của mô hình YOLO.
Hình 5. Guy Dahan nói về tối ưu hóa suy luận mô hình YOLO bằng kiến trúc GPU của NVIDIA.
Các công ty khác như Qualcomm, Hugging Face và Lightning AI cũng giới thiệu cách nền tảng của họ giúp các nhà phát triển dễ dàng tích hợp và triển khai các mô hình YOLO hơn. Devang Aggarwal từ Qualcomm đã trình bày cách các mô hình như YOLOv8 có thể được tối ưu hóa cho các thiết bị Snapdragon thông qua Qualcomm AI Hub.
Tương tự, Pavel Lakubovskii từ Hugging Face đã mô tả cách các công cụ mã nguồn mở của họ cho phép tích hợp liền mạch các mô hình như YOLOv8 vào các quy trình làm việc khác nhau, trong khi Luca Antiga từ Lightning AI đã hướng dẫn chúng ta cách các nhà phát triển có thể dễ dàng kết hợp các mô hình như YOLOv8 ở cấp độ mã để tạo mẫu và lặp lại nhanh hơn.
Một tuần ở Madrid: Các buổi kết nối YOLO Vision
Trong tuần trước YV24, nhóm Ultralytics đã tập trung tại Madrid để tham gia các buổi hội thảo, các cuộc họp hợp tác và các hoạt động ngoại khóa. Những hoạt động này vượt ra ngoài công việc, nuôi dưỡng các mối quan hệ bền chặt hơn và tạo ra một bầu không khí tích cực trước sự kiện. Kết thúc bằng một bữa tiệc ăn mừng, những người tham dự và diễn giả đã có cơ hội kết nối, chia sẻ những điểm chính và khám phá các hợp tác trong tương lai. Sự kết hợp giữa làm việc nhóm và tình bạn đã làm cho YV24 trở thành một thành công chuyên nghiệp và một trải nghiệm đáng nhớ toàn diện.
Hình 6. Đội ngũ Ultralytics ăn mừng một ngày tuyệt vời tại YOLO Vision 2024.
Các đổi mới về YOLO Vision AI và những gì đang chờ đợi phía trước
YV24 đã tập hợp sự đổi mới, hợp tác và cái nhìn về tương lai của thị giác máy tính. Với việc ra mắt YOLO11, các hội thảo hấp dẫn và các cuộc thảo luận về phần cứng AI và các giải pháp biên, sự kiện tập trung vào cách AI thị giác có thể tạo ra sự khác biệt và cách công nghệ đang thay đổi để theo kịp những tiến bộ trong AI. Nó cũng tăng cường các kết nối trong cộng đồng. Các chuyên gia và những người đam mê đã chia sẻ ý tưởng và khám phá tiềm năng của thị giác máy tính và YOLO. Sự kiện kết thúc bằng một buổi đố vui thú vị, nơi áo hoodie Ultralytics đã được trao, khiến mọi người hào hứng chờ đợi nhiều cải tiến hơn như YOLO11 trong tương lai.