Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay

Những điểm nổi bật chính của Ultralytics từ YOLO Vision 2024!

Abirami Vina

4 phút đọc

Ngày 8 tháng 10 năm 2024

Khám phá những điểm nổi bật từ sự kiện thường niên của Ultralytics và sống lại trải nghiệm kết hợp YOLO Vision. Chúng ta sẽ đề cập đến việc ra mắt YOLO11 của Ultralytics, các hội thảo hấp dẫn và nhiều hơn nữa.

Vào ngày 27 tháng 9, Ultralytics đã tập hợp cộng đồng AI và thị giác máy tính cho sự kiện kết hợp hàng năm thú vị của chúng tôi, YOLO Vision 2024 (YV24). Được tổ chức tại Google for Startups Campus ở Madrid và được phát trực tiếp trên toàn cầu, sự kiện đã tập hợp các chuyên gia, nhà phát triển và những người đam mê để thảo luận về những tiến bộ mới nhất trong Vision AI, chẳng hạn như mô hình Ultralytics YOLO11 mới. Luồng trực tiếp của sự kiện đã đạt hơn 5.400 lượt xem, với hơn 10.600 lượt hiển thị và 469,5 giờ xem, thu hút những nhà đổi mới trên khắp thế giới.

YV24 bắt đầu với lời chào đón nồng nhiệt từ người dẫn chương trình của chúng tôi, Oisin Lunny, người đã nhấn mạnh tầm quan trọng của cộng đồng và sự kết nối bằng cách nói: "Tôi là một người rất tin vào sức mạnh của những ý tưởng tuyệt vời và những cộng đồng tuyệt vời, và những gì Ultralytics đã tạo ra với YOLO Vision chính là điều đó - một cộng đồng tuyệt vời của những người tuyệt vời với những ý tưởng tuyệt vời."

Trong bài viết này, chúng ta sẽ chỉ ra những điểm nổi bật chính từ YOLO Vision 2024, từ các phiên thảo luận hấp dẫn đến những trường hợp sử dụng thị giác máy tính thực tế đầy thú vị. Chúng ta cũng sẽ khám phá các buổi nói chuyện kỹ thuật, từ AI biên đến tăng tốc phần cứng, cũng như các khoảnh khắc kết nối và xây dựng cộng đồng đã làm nên thành công của sự kiện. Cho dù bạn quan tâm đến những đổi mới về AI, các thông báo quan trọng hay tương lai của Vision AI, bài tóm tắt sự kiện YOLO Vision 2024 này sẽ bao gồm tất cả những thông tin cần thiết! 

Sự kiện ra mắt Ultralytics YOLO11 tại YOLO Vision

Sản phẩm ra mắt đã được hé lộ trước YOLO Vision 2024 cuối cùng đã được tiết lộ với một thông báo trong bài phát biểu khai mạc của Glenn Jocher, Người sáng lập và Giám đốc điều hành của Ultralytics. Glenn đã giới thiệu Ultralytics YOLO11, đánh dấu thế hệ tiếp theo của các mô hình thị giác máy tính, vốn đã được phát triển trong vài tháng. Thêm vào sự phấn khích của buổi ra mắt, Glenn sau đó đã được phỏng vấn trên The Ravit Show và chia sẻ những hiểu biết về quá trình phát triển của YOLO11.

Trong bài phát biểu quan trọng của mình, Glenn cũng chia sẻ câu chuyện về hành trình của công ty, bắt đầu với nền tảng của ông trong lĩnh vực vật lý hạt và niềm đam mê của ông với việc tìm hiểu vũ trụ cuối cùng đã dẫn ông đến máy học và thị giác máy tính.

__wf_reserved_inherit
Hình 1. Ultralytics YOLO11 đã được Glenn Jocher chính thức công bố trên sân khấu tại YOLO Vision 2024.

Ông giải thích công việc ban đầu của mình trong lĩnh vực vật lý, nơi các nhà nghiên cứu phân tích sự tương tác của các hạt, tương tự như phát hiện đối tượng trong thị giác máy tính. Sự tò mò và động lực làm việc trên công nghệ tiên tiến cuối cùng đã dẫn đến việc tạo ra Ultralytics YOLOv5. Trong suốt buổi nói chuyện, Glenn nhấn mạnh tầm quan trọng của sự hợp tác và đóng góp trong cộng đồng mã nguồn mở và cảm ơn các nhà phát triển trên toàn thế giới đã cung cấp phản hồi và giúp cải thiện YOLOv5 và Ultralytics YOLOv8 theo thời gian.

Sau đó, ông giới thiệu các tính năng chính của Ultralytics YOLO11 và giải thích rằng nó nhanh hơn, chính xác hơn và hiệu quả hơn so với các mô hình trước đó. Trên thực tế, YOLO11m sử dụng ít hơn 22% tham số so với YOLOv8m nhưng mang lại độ chính xác tốt hơn trên tập dữ liệu COCO, khiến YOLO11 trở nên hoàn hảo cho các ứng dụng thời gian thực, nơi tốc độ và độ chính xác là nền tảng.

Glenn nhấn mạnh quy mô của việc ra mắt bằng cách nói: "Chúng tôi đang ra mắt tổng cộng 30 mô hình, 25 trong số đó là mã nguồn mở, với năm kích thước khác nhau cho năm tác vụ khác nhau. Các tác vụ là phân loại ảnh, phát hiện đối tượng, phân đoạn thể hiện, ước tính tư thếhộp giới hạn theo hướng." Về phía doanh nghiệp, ông thông báo rằng vào tháng tới, các mô hình mạnh mẽ được huấn luyện trên bộ dữ liệu độc quyền gồm 1 triệu hình ảnh sẽ có sẵn. Không cần phải nói, thông báo đã khởi động sự kiện một cách tốt đẹp, khiến những người tham dự háo hức tìm hiểu thêm về tiềm năng của YOLO11 để đổi mới trong các lĩnh vực như sản xuấtxe tự lái.

Thảo luận nhóm tại YOLO Vision: Hội nghị AI

Các cuộc thảo luận nhóm, được điều phối bởi Oisin Lunny, tại YOLO Vision 2024 đã cung cấp một loạt các hiểu biết sâu sắc về AI, thị giác máy tính và xây dựng cộng đồng. 

Hội thảo đầu tiên có sự góp mặt của Glenn Jocher, Jing Qiu (một nhân vật chủ chốt trong quá trình phát triển các mô hình YOLO tại Ultralytics) và Ao Wang từ Đại học Thanh Hoa, đồng tác giả của YOLOv10. Hội thảo đã thảo luận về những phát triển gần đây trong AI tạo sinhthị giác máy tính, tập trung vào những điểm tương đồng, khác biệt và tác động của mỗi lĩnh vực đối với lĩnh vực còn lại. Bất chấp sự trỗi dậy gần đây của các mô hình ngôn ngữ lớn (LLM), hội thảo lưu ý rằng thị giác máy tính truyền thống vẫn rất cần thiết cho các tác vụ cụ thể trong các ngành như chăm sóc sức khỏe

Hội thảo tiếp theo đề cập đến những thách thức mà phụ nữ phải đối mặt trong vai trò lãnh đạo AI, với các diễn giả: Giám đốc tăng trưởng của Ultralytics Paula Derrenger, cựu CPO và COO trong SaaS Bruna de Guimarães, Trưởng nhóm chi nhánh cho Latinas in Tech Madrid Mariana Hernandez, và Người sáng lập Dare to Data Christina Stathopoulous chia sẻ kinh nghiệm của họ, đồng thời thảo luận về tầm quan trọng của việc cố vấn và sự cần thiết của phụ nữ trong việc chủ động thực hiện các bước để tìm kiếm vai trò lãnh đạo. Hernandez khuyên, "Hãy chủ động, đừng chờ đợi mọi thứ xảy ra với bạn," và khuyến khích phụ nữ trong khán giả khẳng định bản thân và chủ động theo đuổi các cơ hội. Hội thảo cũng thảo luận về giá trị của việc tạo ra môi trường làm việc hỗ trợ hơn.

__wf_reserved_inherit
Hình 2. Một buổi thảo luận về phụ nữ trong lĩnh vực công nghệ, từ trái sang phải: Christina Stathopoulous, Paula Derrenger, Mariana Hernandez, Oisin Lunny, với Bruna de Guimarães tham gia từ xa.

Hội thảo cuối cùng đã khám phá cách xây dựng các cộng đồng vững mạnh có thể thúc đẩy sự đổi mới trong AI. Burhan Qaddoumi, Harpreet SahotaBart Farrell đã thảo luận về các cách để tương tác với khán giả kỹ thuật, cả trực tuyến và tại các sự kiện trực tiếp. Quan điểm của Farrell, "Bạn phải gặp họ ở nơi họ đang ở", nhấn mạnh tầm quan trọng của việc kết nối với các thành viên cộng đồng theo cách của họ để khuyến khích sự hợp tác và học hỏi lẫn nhau.

__wf_reserved_inherit
Hình 3. Một buổi thảo luận về xây dựng cộng đồng, từ trái sang phải: Harpreet Sahota, Burhan Qaddoumi, Bart Farrell và Oisin Lunny.

Các ví dụ thực tế về đổi mới AI tại YOLO Vision

Một số bài nói chuyện tại YV24 đã làm sáng tỏ cách các mô hình YOLO đang được áp dụng để giải quyết các thách thức thực tế trong nhiều ngành công nghiệp khác nhau. Jim Griffin, người dẫn chương trình podcast AI Master Group, đã nói về một dự án sử dụng các mô hình YOLOv8 để theo dõi sự di chuyển của cá mập dọc theo bờ biển California thông qua giám sát bằng máy bay không người lái. Hệ thống cảnh báo nhân viên cứu hộ, chủ cửa hàng lướt sóng và phụ huynh, đảm bảo an toàn cho người đi biển bằng cách phát hiện cá mập từ độ cao 200 feet so với mặt biển. Griffin giải thích rằng thách thức thực sự không phải là bản thân mô hình AI mà là các chuyến bay bằng máy bay không người lái và thu thập dữ liệu rộng rãi cần thiết để huấn luyện mô hình.

__wf_reserved_inherit
Hình 4. Jim Griffin chia sẻ cách YOLOv8 đang được sử dụng để theo dõi sự di chuyển của cá mập dọc theo bờ biển California bằng máy bay không người lái.

Tương tự, David Scott từ The Main Branch đã thảo luận về sự mở rộng của thị giác máy tính từ phát hiện đối tượng đơn giản sang phân tích hành vi. Bài nói của ông có các ứng dụng thực tế như theo dõi hành vi của gia súcxác định các hoạt động đáng ngờ trong các cửa hàng bán lẻ. Scott chia sẻ cách YOLOv8 có thể được sử dụng để theo dõi sức khỏe của gia súc bằng cách phân tích các hành vi cụ thể, chẳng hạn như ăn, uống và đi lại.

Hơn nữa, một bài phát biểu quan trọng đặc biệt cảm động đến từ Ousman Umar của NASCO Feeding Minds, nơi ông chia sẻ cách tổ chức của mình đang thay đổi cuộc sống bằng cách cung cấp giáo dục CNTT ở Ghana. Tổ chức của ông đã thành lập 17 trung tâm ICT, đào tạo hơn 65.000 sinh viên, với mục tiêu tạo ra việc làm công nghệ tại địa phương để giúp giải quyết các vấn đề như nhập cư bất hợp pháp. Câu chuyện mạnh mẽ của Umar đã truyền tải cách giáo dục và công nghệ cùng nhau có thể thúc đẩy sự thay đổi lâu dài trong các cộng đồng khó khăn.

Các buổi nói chuyện về công nghệ: Điểm nổi bật của diễn giả YOLO Vision

YV24 cũng giới thiệu các buổi nói chuyện khác nhau tập trung vào cách AI và phần cứng kết hợp với nhau để tạo ra những ý tưởng mới. Các chuyên gia từ các công ty như Intel, SonyNVIDIA đã đề cập đến việc triển khai các mô hình YOLO trên các thiết bị biên (edge device) và tối ưu hóa hiệu suất. Dmitriy PastushenkovAdrian Boguszewski từ Intel đã trình bày cách phần cứng của họ hỗ trợ các mô hình YOLO trên NPU, CPU và GPU, trong khi Amir ServiWei Tang của Sony đã chia sẻ cách YOLO tích hợp với nền tảng AITRIOS để triển khai AI biên hiệu quả. Guy Dahan từ NVIDIA đã nói về việc sử dụng kiến trúc GPU của họ để cải thiện quá trình suy luận (inference) của mô hình YOLO. 

__wf_reserved_inherit
Hình 5. Guy Dahan nói về tối ưu hóa suy luận mô hình YOLO bằng kiến trúc GPU của NVIDIA.

Các công ty khác như Qualcomm, Hugging FaceLightning AI cũng giới thiệu cách nền tảng của họ giúp các nhà phát triển dễ dàng tích hợp và triển khai các mô hình YOLO hơn. Devang Aggarwal từ Qualcomm đã trình bày cách các mô hình như YOLOv8 có thể được tối ưu hóa cho các thiết bị Snapdragon thông qua Qualcomm AI Hub.

Tương tự, Pavel Lakubovskii từ Hugging Face đã mô tả cách các công cụ mã nguồn mở của họ cho phép tích hợp liền mạch các mô hình như YOLOv8 vào các quy trình làm việc khác nhau, trong khi Luca Antiga từ Lightning AI đã hướng dẫn chúng ta cách các nhà phát triển có thể dễ dàng kết hợp các mô hình như YOLOv8 ở cấp độ mã để tạo mẫu và lặp lại nhanh hơn.

Một tuần ở Madrid: Các buổi kết nối YOLO Vision

Trong tuần trước YV24, nhóm Ultralytics đã tập trung tại Madrid để tham gia các buổi hội thảo, các cuộc họp hợp tác và các hoạt động ngoại khóa. Những hoạt động này vượt ra ngoài công việc, nuôi dưỡng các mối quan hệ bền chặt hơn và tạo ra một bầu không khí tích cực trước sự kiện. Kết thúc bằng một bữa tiệc ăn mừng, những người tham dự và diễn giả đã có cơ hội kết nối, chia sẻ những điểm chính và khám phá các hợp tác trong tương lai. Sự kết hợp giữa làm việc nhóm và tình bạn đã làm cho YV24 trở thành một thành công chuyên nghiệp và một trải nghiệm đáng nhớ toàn diện.

__wf_reserved_inherit
Hình 6. Đội ngũ Ultralytics ăn mừng một ngày tuyệt vời tại YOLO Vision 2024.

Các đổi mới về YOLO Vision AI và những gì đang chờ đợi phía trước

YV24 đã tập hợp sự đổi mới, hợp tác và cái nhìn về tương lai của thị giác máy tính. Với việc ra mắt YOLO11, các hội thảo hấp dẫn và các cuộc thảo luận về phần cứng AI và các giải pháp biên, sự kiện tập trung vào cách AI thị giác có thể tạo ra sự khác biệt và cách công nghệ đang thay đổi để theo kịp những tiến bộ trong AI. Nó cũng tăng cường các kết nối trong cộng đồng. Các chuyên gia và những người đam mê đã chia sẻ ý tưởng và khám phá tiềm năng của thị giác máy tính và YOLO. Sự kiện kết thúc bằng một buổi đố vui thú vị, nơi áo hoodie Ultralytics đã được trao, khiến mọi người hào hứng chờ đợi nhiều cải tiến hơn như YOLO11 trong tương lai.

Hãy truy cập kho lưu trữ GitHub của chúng tôi và kết nối với cộng đồng đang phát triển mạnh mẽ của chúng tôi để tìm hiểu thêm về AI. Xem cách Vision AI đang định nghĩa lại sự đổi mới trong các lĩnh vực như chăm sóc sức khỏenông nghiệp. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard