Những điểm nổi bật chính của Ultralytics từ YOLO Vision 2024!
Khám phá những điểm nổi bật từ sự kiện thường niên của Ultralytics và sống lại trải nghiệm YOLO Vision kết hợp. Chúng tôi sẽ đề cập đến sự kiện ra mắt Ultralytics YOLO11, các phiên thảo luận hấp dẫn và nhiều nội dung khác.

Vào ngày 27 tháng 9, Ultralytics đã quy tụ cộng đồng AI và computer vision đến với sự kiện hybrid thường niên đầy thú vị của chúng tôi, YOLO Vision 2024 (YV24). Được tổ chức tại Google for Startups Campus ở Madrid và phát trực tuyến trên toàn cầu, sự kiện đã thu hút các chuyên gia, nhà phát triển và những người đam mê để cùng thảo luận về những tiến bộ mới nhất trong lĩnh vực vision AI, chẳng hạn như model Ultralytics YOLO11 mới. Buổi phát trực tiếp của sự kiện đã đạt hơn 5.400 lượt xem, với hơn 10.600 lượt hiển thị và 469,5 giờ xem, thu hút sự quan tâm của những người đổi mới trên toàn thế giới.
YV24 bắt đầu với lời chào đón nồng nhiệt từ người dẫn chương trình Oisin Lunny, người đã nhấn mạnh tầm quan trọng của cộng đồng và sự kết nối bằng cách nói: "Tôi là người rất tin tưởng vào sức mạnh của những ý tưởng tuyệt vời và những cộng đồng tuyệt vời, và những gì Ultralytics đã tạo ra với YOLO Vision chính là như vậy - một cộng đồng tuyệt vời gồm những con người tuyệt vời với những ý tưởng tuyệt vời."
Trong bài viết này, chúng tôi sẽ nêu bật những điểm chính từ YOLO Vision 2024, từ các phiên thảo luận chuyên đề hấp dẫn đến các use case của computer vision trong thực tế đầy thú vị. Chúng tôi cũng sẽ khám phá các bài nói chuyện kỹ thuật từ edge AI đến tăng tốc phần cứng, cũng như những khoảnh khắc kết nối và xây dựng cộng đồng đã làm nên thành công của sự kiện. Cho dù bạn quan tâm đến những đổi mới về AI, các thông báo quan trọng hay tương lai của vision AI, bản tóm tắt sự kiện YOLO Vision 2024 này sẽ bao quát tất cả những điểm cốt lõi cần thiết!
Link to this sectionRa mắt Ultralytics YOLO11 tại YOLO Vision#
Sản phẩm đã được hé lộ trước YOLO Vision 2024 cuối cùng đã được công bố trong bài phát biểu quan trọng đầu tiên bởi Glenn Jocher, Nhà sáng lập kiêm CEO của Ultralytics. Glenn đã giới thiệu Ultralytics YOLO11, đánh dấu thế hệ tiếp theo của các model computer vision, vốn đã được phát triển trong vài tháng qua. Thêm vào sự hào hứng của buổi ra mắt, Glenn sau đó đã được phỏng vấn trên The Ravit Show và chia sẻ những thông tin chi tiết về quá trình phát triển YOLO11.
Trong bài phát biểu của mình, Glenn cũng chia sẻ câu chuyện về hành trình của công ty, bắt đầu từ nền tảng của ông trong lĩnh vực vật lý hạt và niềm đam mê tìm hiểu vũ trụ đã dẫn dắt ông đến với machine learning và computer vision như thế nào.

Hình 1. Ultralytics YOLO11 được Glenn Jocher công bố chính thức trên sân khấu tại YOLO Vision 2024.
Ông giải thích cách mà công việc thời kỳ đầu của mình trong lĩnh vực vật lý, nơi các nhà nghiên cứu phân tích tương tác hạt, cũng tương tự như object detection trong computer vision. Sự tò mò và nỗ lực làm việc với công nghệ tiên tiến cuối cùng đã dẫn đến sự ra đời của Ultralytics YOLOv5. Trong suốt bài nói chuyện, Glenn nhấn mạnh tầm quan trọng của sự hợp tác và đóng góp cho cộng đồng open-source, đồng thời cảm ơn các nhà phát triển trên toàn thế giới đã cung cấp phản hồi và giúp cải thiện YOLOv5 cũng như Ultralytics YOLOv8 theo thời gian.
Sau đó, ông giới thiệu các tính năng chính của Ultralytics YOLO11 và giải thích rằng nó nhanh hơn, chính xác hơn và hiệu quả hơn các model trước đó. Trên thực tế, YOLO11m sử dụng ít hơn 22% tham số so với YOLOv8m nhưng lại mang lại độ chính xác tốt hơn trên dataset COCO, khiến YOLO11 trở nên hoàn hảo cho các ứng dụng thời gian thực nơi tốc độ và độ chính xác là nền tảng.
Glenn nhấn mạnh quy mô của đợt ra mắt bằng cách nói: "Chúng tôi đang tung ra tổng cộng 30 model, trong đó 25 model là mã nguồn mở, với 5 kích thước khác nhau cho 5 tác vụ khác nhau. Các tác vụ đó là image classification, object detection, instance segmentation, pose estimation và oriented bounding boxes." Về phía doanh nghiệp, ông thông báo rằng vào tháng tới, các model mạnh mẽ được huấn luyện trên một dataset độc quyền gồm 1 triệu hình ảnh sẽ được ra mắt. Không cần phải nói, thông báo này đã mở đầu sự kiện một cách ấn tượng, khiến những người tham dự háo hức tìm hiểu thêm về tiềm năng của YOLO11 trong việc đổi mới trên các lĩnh vực như manufacturing và self-driving cars.
Link to this sectionCác phiên thảo luận chuyên đề tại YOLO Vision: Một hội nghị về AI#
Các phiên thảo luận chuyên đề do Oisin Lunny điều phối tại YOLO Vision 2024 đã cung cấp nhiều thông tin chi tiết về AI, computer vision và xây dựng cộng đồng.
Phiên thảo luận đầu tiên có sự tham gia của Glenn Jocher, Jing Qiu (một nhân vật chủ chốt trong quá trình phát triển các model YOLO tại Ultralytics), và Ao Wang từ Đại học Thanh Hoa, đồng tác giả của YOLOv10. Phiên thảo luận đã bàn về những phát triển gần đây trong generative AI và computer vision, tập trung vào sự tương đồng, khác biệt và tác động của mỗi lĩnh vực đối với lĩnh vực còn lại. Mặc dù gần đây có sự trỗi dậy của các large language models (LLMs), phiên thảo luận lưu ý rằng computer vision truyền thống vẫn rất cần thiết cho các tác vụ cụ thể trong các ngành như healthcare.
Phiên thảo luận tiếp theo đề cập đến những thách thức mà phụ nữ phải đối mặt trong vai trò lãnh đạo AI, với các diễn giả: Giám đốc Tăng trưởng của Ultralytics Paula Derrenger, cựu CPO và COO trong lĩnh vực SaaS Bruna de Guimarães, Trưởng nhóm Chapter Latinas in Tech tại Madrid Mariana Hernandez, và Nhà sáng lập của Dare to Data Christina Stathopoulous cùng chia sẻ kinh nghiệm của họ, đồng thời thảo luận về tầm quan trọng của việc cố vấn và nhu cầu phụ nữ chủ động tìm kiếm các vị trí lãnh đạo. Hernandez đưa ra lời khuyên: "Hãy chủ động, đừng đợi mọi thứ tự xảy ra với bạn," và khuyến khích phụ nữ trong khán giả hãy khẳng định mình và tích cực theo đuổi các cơ hội. Phiên thảo luận cũng thảo luận về giá trị của việc tạo ra môi trường làm việc hỗ trợ nhiều hơn.

Hình 2. Một phiên thảo luận về phụ nữ trong lĩnh vực công nghệ, từ trái sang phải: Christina Stathopoulous, Paula Derrenger, Mariana Hernandez, Oisin Lunny, cùng với Bruna de Guimarães tham gia từ xa.
Phiên thảo luận cuối cùng đã khám phá cách xây dựng các cộng đồng vững mạnh để thúc đẩy đổi mới trong AI. Burhan Qaddoumi, Harpreet Sahota và Bart Farrell đã thảo luận về các cách để tương tác với đối tượng người dùng kỹ thuật, cả trực tuyến và tại các sự kiện trực tiếp. Góc nhìn của Farrell: "Bạn phải gặp họ ở nơi họ xuất hiện," đã nhấn mạnh tầm quan trọng của việc kết nối với các thành viên cộng đồng theo điều kiện của họ để khuyến khích sự hợp tác và học hỏi lẫn nhau.

Hình 3. Một phiên thảo luận về xây dựng cộng đồng, từ trái sang phải: Harpreet Sahota, Burhan Qaddoumi, Bart Farrell và Oisin Lunny.
Link to this sectionCác ví dụ thực tế về đổi mới AI tại YOLO Vision#
Một số bài nói chuyện tại YV24 đã làm sáng tỏ cách các model YOLO đang được ứng dụng để giải quyết những thách thức thực tế trong nhiều ngành khác nhau. Jim Griffin, người dẫn chương trình AI Master Group podcast, đã nói về một dự án sử dụng các model YOLOv8 để theo dõi chuyển động của cá mập dọc theo bờ biển California thông qua giám sát bằng drone. Hệ thống này cảnh báo nhân viên cứu hộ, chủ cửa hàng lướt sóng và các bậc phụ huynh, đảm bảo an toàn cho người đi biển bằng cách phát hiện cá mập từ độ cao 200 feet so với mặt biển. Griffin giải thích rằng thách thức thực sự không nằm ở bản thân model AI mà là ở việc thực hiện các chuyến bay bằng drone dày đặc và thu thập dữ liệu cần thiết để huấn luyện model.

Hình 4. Jim Griffin chia sẻ cách YOLOv8 được sử dụng để theo dõi chuyển động của cá mập dọc theo bờ biển California bằng drone.
Tương tự, David Scott từ The Main Branch đã thảo luận về việc mở rộng computer vision từ nhận diện đối tượng đơn giản sang phân tích hành vi. Bài nói chuyện của ông đề cập đến các ứng dụng thực tế như theo dõi hành vi của gia súc và xác định các hành vi đáng ngờ trong cửa hàng bán lẻ. Scott chia sẻ cách YOLOv8 có thể được sử dụng để theo dõi sức khỏe gia súc bằng cách phân tích các hành vi cụ thể, chẳng hạn như ăn, uống và đi lại.
Hơn nữa, một bài phát biểu đặc biệt cảm động đến từ Ousman Umar của NASCO Feeding Minds, nơi ông chia sẻ cách tổ chức của mình đang thay đổi cuộc sống bằng cách cung cấp giáo dục CNTT tại Ghana. Quỹ của ông đã thành lập 17 trung tâm CNTT, đào tạo hơn 65.000 học sinh, với mục tiêu tạo ra các công việc công nghệ tại địa phương để giúp giải quyết các vấn đề như nhập cư bất hợp pháp. Câu chuyện mạnh mẽ của Umar đã truyền tải thông điệp về việc giáo dục và công nghệ kết hợp cùng nhau có thể thúc đẩy sự thay đổi lâu dài ở những cộng đồng khó khăn như thế nào.
Link to this sectionCác bài nói chuyện kỹ thuật: Điểm nhấn từ diễn giả tại YOLO Vision#
YV24 cũng có nhiều bài nói chuyện tập trung vào việc AI và phần cứng đang kết hợp như thế nào để khơi nguồn ý tưởng mới. Các chuyên gia từ những công ty như Intel, Sony và NVIDIA đã đề cập đến việc triển khai các model YOLO trên các thiết bị edge và tối ưu hóa hiệu suất. Dmitriy Pastushenkov và Adrian Boguszewski từ Intel đã phác thảo cách phần cứng của họ hỗ trợ các model YOLO trên NPU, CPU và GPU, trong khi Amir Servi và Wei Tang của Sony chia sẻ cách YOLO tích hợp với nền tảng AITRIOS để triển khai edge AI hiệu quả. Guy Dahan từ NVIDIA đã nói về việc sử dụng kiến trúc GPU của họ để cải thiện hiệu suất inference của model YOLO.

Hình 5. Guy Dahan nói về việc tối ưu hóa inference model YOLO sử dụng kiến trúc GPU của NVIDIA.
Các công ty khác như Qualcomm, Hugging Face và Lightning AI cũng đã giới thiệu cách các nền tảng của họ giúp các nhà phát triển dễ dàng tích hợp và triển khai các model YOLO hơn. Devang Aggarwal từ Qualcomm đã trình bày cách các model như YOLOv8 có thể được tối ưu hóa cho các thiết bị Snapdragon thông qua Qualcomm AI Hub.
Tương tự, Pavel Lakubovskii từ Hugging Face đã mô tả cách các công cụ mã nguồn mở của họ cho phép tích hợp liền mạch các model như YOLOv8 vào các quy trình công việc khác nhau, trong khi Luca Antiga từ Lightning AI đã hướng dẫn chúng ta cách các nhà phát triển có thể dễ dàng kết hợp các model như YOLOv8 ở cấp độ code để tạo mẫu và lặp lại nhanh hơn.
Link to this sectionMột tuần tại Madrid: Các phiên kết nối tại YOLO Vision#
Trong tuần trước khi YV24 diễn ra, đội ngũ Ultralytics đã tập trung tại Madrid cho sự kết hợp giữa các hội thảo, các cuộc họp hợp tác và các hoạt động ngoài lề. Những hoạt động này không chỉ dừng lại ở công việc, mà còn nuôi dưỡng các mối quan hệ bền chặt hơn và tạo ra bầu không khí tích cực trước sự kiện. Kết thúc bằng bữa tiệc ăn mừng, các khách tham dự và diễn giả đã có cơ hội kết nối, chia sẻ những điểm chính và khám phá các cơ hội hợp tác trong tương lai. Sự kết hợp giữa làm việc nhóm và tình đồng đội đã làm nên thành công chuyên nghiệp của YV24 và một trải nghiệm đáng nhớ về mọi mặt.

Hình 6. Đội ngũ Ultralytics ăn mừng một ngày tuyệt vời tại YOLO Vision 2024.
Link to this sectionNhững đổi mới về AI tại YOLO Vision và tương lai phía trước#
YV24 đã quy tụ sự đổi mới, hợp tác và một cái nhìn về tương lai của computer vision. Với việc ra mắt YOLO11, các phiên thảo luận hấp dẫn cùng các buổi bàn luận về phần cứng AI và các giải pháp edge, sự kiện tập trung vào việc vision AI có thể tạo ra sự khác biệt như thế nào và công nghệ đang thay đổi ra sao để bắt kịp với những tiến bộ trong AI. Nó cũng củng cố các kết nối trong cộng đồng. Các chuyên gia và những người đam mê đã chia sẻ ý tưởng và khám phá tiềm năng của computer vision cũng như YOLO. Sự kiện đã kết thúc với một phiên đố vui đầy thú vị, nơi các chiếc áo hoodie của Ultralytics đã tìm được chủ nhân, để lại trong lòng mọi người sự phấn khích cho những đổi mới như YOLO11 trong tương lai.
Hãy truy cập GitHub repository của chúng tôi và kết nối với cộng đồng thịnh vượng của chúng tôi để tìm hiểu thêm về AI. Hãy xem cách Vision AI đang định nghĩa lại sự đổi mới trong các lĩnh vực như healthcare và agriculture. 🚀






