Hãy cùng chúng tôi tóm tắt lại sự kiện lớn nhất trong năm của Ultralytics, giới thiệu buổi ra mắt Ultralytics YOLO26, các buổi thảo luận truyền cảm hứng và những điểm nổi bật quan trọng của cộng đồng.

Hãy cùng chúng tôi tóm tắt lại sự kiện lớn nhất trong năm của Ultralytics, giới thiệu buổi ra mắt Ultralytics YOLO26, các buổi thảo luận truyền cảm hứng và những điểm nổi bật quan trọng của cộng đồng.
Cộng đồng AI và thị giác máy tính đã tụ họp vào ngày 25 tháng 9 tại YOLO Vision 2025 (YV25) , sự kiện Vision AI kết hợp thường niên của Ultralytics. Được tổ chức tại The Pelligon, London và phát trực tuyến trên toàn thế giới, sự kiện chào đón một nhóm đa dạng các nhà nghiên cứu, kỹ sư và những người đam mê AI để chia sẻ ý tưởng và tìm hiểu về những đổi mới, chẳng hạn như Ultralytics YOLO26 .
Đánh dấu năm thứ tư, sự kiện này tiếp tục phát triển về phạm vi tiếp cận và tác động. Buổi phát trực tiếp YV25 đã thu hút hơn 6.800 lượt xem, tạo ra hơn 49.000 lượt hiển thị và đạt gần 2.000 giờ xem.
YV25 bắt đầu với bài phát biểu khai mạc của người dẫn chương trình Oisin Lunny , người đã định hình không khí của ngày hội bằng cách khuyến khích người tham dự kết nối, chia sẻ và tận dụng tối đa sự kiện. Như ông đã nói, "YOLO Vision 2025 là hội nghị kết nối cộng đồng AI thị giác nguồn mở để tập trung vào những tiến bộ về dữ liệu, học máy và thị giác máy tính."
Trong bài viết này, chúng tôi sẽ tóm tắt những điểm nổi bật chính của YOLO Vision 2025, bao gồm buổi ra mắt sản phẩm, các bài phát biểu quan trọng, hội thảo chuyên đề, demo trực tiếp và những khoảnh khắc cộng đồng làm nên sự kiện đặc biệt này. Cùng bắt đầu thôi!
Trước sự kiện, có rất nhiều sự phấn khích xung quanh việc ra mắt sản phẩm mới và Glenn Jocher , Nhà sáng lập kiêm Giám đốc điều hành của chúng tôi, đã bắt đầu ngày mới bằng cách phát huy nguồn năng lượng đó.
Anh ấy đã chia sẻ hành trình của Ultralytics, nhớ lại việc vào năm 2020, anh đã chạy thử nghiệm trên một chiếc 1080 Ti duy nhất được cắm vào MacBook của mình, một thiết lập đã lỗi thời ngày nay. Từ những khởi đầu khiêm tốn đó, Ultralytics đã phát triển thành một cộng đồng toàn cầu với hàng tỷ suy luận hàng ngày được hỗ trợ bởi các mô hình YOLO.
Glenn cũng chia sẻ về việc Ultralytics gần đây đã hoàn tất vòng gọi vốn Series A trị giá 30 triệu đô la . Ông giải thích khoản đầu tư này sẽ thúc đẩy giai đoạn tăng trưởng tiếp theo bằng cách cho phép công ty mở rộng quy mô đội ngũ, mở rộng nghiên cứu và đảm bảo các nguồn lực điện toán cần thiết để tiếp tục mở rộng ranh giới của thị giác máy tính.
Glenn tiếp tục công bố hai nỗ lực mới từ Ultralytics. Đầu tiên là Ultralytics YOLO26, model mới nhất trong dòng Ultralytics YOLO, được thiết kế nhỏ gọn hơn, nhanh hơn và hiệu quả hơn, đồng thời đạt được độ chính xác cao hơn. Thứ hai là Ultralytics Platform, một không gian làm việc SaaS toàn diện mới, kết hợp dữ liệu, đào tạo, triển khai và giám sát, giúp việc xây dựng các giải pháp thị giác máy tính trở nên dễ dàng hơn bao giờ hết, dự kiến sẽ được công bố trong tương lai gần.
YOLO26 được thiết kế để nâng cao hiệu suất nhưng vẫn đảm bảo tính thực tiễn khi sử dụng. Phiên bản nhỏ nhất hiện đã chạy nhanh hơn tới 43% trên CPU, đồng thời vẫn cải thiện độ chính xác, lý tưởng cho các ứng dụng từ thiết bị di động đến hệ thống doanh nghiệp lớn. YOLO26 sẽ được phát hành rộng rãi vào cuối tháng 10.
Sau đây là cái nhìn tổng quan về các tính năng chính của YOLO26 :
Sau khi giới thiệu YOLO26, Glenn đã mời Prateek Bhatnagar , Trưởng bộ phận Kỹ thuật Sản phẩm của chúng tôi, đến trình diễn dự án tiếp theo sắp ra mắt, Nền tảng Ultralytics. Được xây dựng để đơn giản hóa toàn bộ quy trình làm việc thị giác máy tính, nền tảng này hướng đến việc tập hợp các tập dữ liệu, chú thích, đào tạo, triển khai và giám sát tại một nơi.
Prateek so sánh nó với việc độ xe: thay vì phải đến nhiều cửa hàng khác nhau để mua lốp, động cơ và hộp số, mọi thứ đều diễn ra trong một gara. Tương tự như vậy, nền tảng này cung cấp cho các nhà phát triển một không gian làm việc tích hợp để quản lý toàn bộ vòng đời của một mô hình AI thị giác.
Bản demo giới thiệu các công cụ chú thích hỗ trợ AI giúp tăng tốc quá trình chuẩn bị tập dữ liệu, các tùy chọn đào tạo có thể tùy chỉnh cho cả chuyên gia và người mới bắt đầu, cũng như theo dõi quá trình đào tạo theo thời gian thực.
Một điểm nhấn khác của YV25 là buổi hội thảo về triển khai biên, do Oisin Lunny điều phối. Phiên thảo luận có sự tham gia của Yuki Tsuji từ Sony Semiconductor Solutions, David Plowman từ Raspberry Pi, và Glenn Jocher.
Buổi thảo luận đã khám phá cách thức đưa AI đến vùng biên (edge) giúp giảm độ trễ, giảm chi phí và cải thiện quyền riêng tư. Yuki đã giới thiệu cảm biến IMX500 của Sony, có thể chạy suy luận trực tiếp trên chip. Trong khi đó, David chia sẻ về việc Raspberry Pi đang mở rộng từ một nhà sản xuất ban đầu sang các ứng dụng thương mại quy mô lớn.
Hội thảo cũng đề cập đến một trong những rào cản lớn nhất đối với các nhà phát triển: làm sao để các mô hình chạy mượt mà trên nhiều thiết bị khác nhau. Đây chính là nơi gói Python Ultralytics đóng vai trò then chốt.
Với nhiều tùy chọn xuất dữ liệu, Ultralytics giúp việc chuyển đổi mô hình đã được đào tạo sang môi trường sản xuất trên thiết bị di động, hệ thống nhúng hoặc phần cứng doanh nghiệp trở nên dễ dàng. Bằng cách loại bỏ những khó khăn trong việc chuyển đổi mô hình, Ultralytics giúp các nhóm tập trung vào việc xây dựng giải pháp thay vì vật lộn với các vấn đề về khả năng tương thích.
Như David đã giải thích, “Tôi biết từ kinh nghiệm cay đắng của mình rằng việc chuyển đổi mô hình rất khó khăn, và nếu có người khác làm điều đó thay tôi, mọi thứ sẽ dễ dàng hơn rất nhiều. Đó chính là lúc Ultralytics thực sự cải thiện câu chuyện và mang đến những giá trị hữu ích cho người dùng của chúng tôi.”
Những tiến bộ về phần mềm AI đang diễn ra song song với phần cứng, và cùng nhau, chúng đang thúc đẩy một làn sóng đổi mới mới trong lĩnh vực thị giác máy tính. Mặc dù các mô hình như Ultralytics YOLO tiếp tục thúc đẩy độ chính xác, nhưng tác động thực tế của chúng cũng phụ thuộc vào nền tảng mà chúng chạy.
Ví dụ, Seeed Studio đã trình diễn cách phần cứng dạng mô-đun, chi phí thấp như bo mạch reCamera và XIAO của họ, được cài đặt sẵn các mô hình Ultralytics YOLO, giúp các nhà phát triển dễ dàng chuyển từ nguyên mẫu sang hệ thống AI thực tế. Sự tích hợp phần cứng-phần mềm này giúp giảm thiểu rào cản gia nhập và cho thấy sự đổi mới ở cấp độ phần cứng trực tiếp thúc đẩy quá trình áp dụng.
Sau đây là một số điểm chính từ các bài phát biểu quan trọng khác tại YV25 nhấn mạnh cách thiết kế đồng bộ phần cứng-phần mềm đang mở ra những khả năng mới:
Với những tiến bộ về cả phần mềm và phần cứng song hành, thị giác máy tính đang phát triển nhanh hơn bao giờ hết. Những phát triển song song này không chỉ cải thiện độ chính xác và tốc độ mà còn định hình cách thức triển khai AI thị giác trong thế giới thực. Tại YV25, người tham dự đã có cơ hội lắng nghe các chuyên gia trong lĩnh vực robot, triển khai biên và AI đa phương thức, mỗi chuyên gia đều đưa ra một góc nhìn khác nhau về hướng đi của lĩnh vực này.
Ví dụ, trong bài phát biểu quan trọng của mình, Michael Hart từ D-Robotics đã trình diễn cách ghép nối các mô hình Ultralytics YOLO với bo mạch RDK X5 nhỏ gọn (một mô-đun thị giác AI nhúng nhỏ gọn) cho phép robot chạy các mô hình thị giác tiên tiến theo thời gian thực. Bản demo trực tiếp của ông đã cho thấy ngành robot đã phát triển đến mức nào, từ các thí nghiệm trong phòng thí nghiệm thành các hệ thống thực tế, được hỗ trợ bởi AI.
Tương tự, Alexis Crowell và Steven Hunsche từ Axelera AI đã nhấn mạnh những thách thức và cơ hội của việc triển khai AI thị giác tại biên. Thông qua các bản demo trực tiếp, họ đã giải thích cách Bộ xử lý AI Metis (AIPU) của Axelera AI kết hợp RISC-V và điện toán trong bộ nhớ kỹ thuật số để mang lại hiệu suất cao với mức tiêu thụ điện năng rất thấp. Được đóng gói trong các chuẩn kết nối quen thuộc như M.2 và PCIe, thiết kế đồng bộ phần cứng-phần mềm của nền tảng này giúp việc mở rộng AI biên trở nên thiết thực và hiệu quả.
Trong một phiên thảo luận khác, Merve Noyan từ Hugging Face đã khám phá sự trỗi dậy của AI đa phương thức, nơi các mô hình kết hợp hình ảnh với văn bản, âm thanh và các yếu tố đầu vào khác. Cô đã chia sẻ về các trường hợp sử dụng, từ phân tích tài liệu đến các tác nhân hiện thân, đồng thời nhấn mạnh cách đổi mới nguồn mở đang thúc đẩy việc áp dụng AI.
Bên cạnh những bài thuyết trình tổng quan đầy cảm hứng, YV25 còn bao gồm các buổi thực hành chuyên sâu. Jiri Borovec từ Lightning AI đã hướng dẫn thực hành cách huấn luyện và tinh chỉnh các mô hình Ultralytics YOLO với PyTorch Lightning và hỗ trợ đa GPU.
Anh ấy đã trình bày các ví dụ mã và nhấn mạnh cách các công cụ nguồn mở, tài liệu hướng dẫn rõ ràng và các khuôn khổ linh hoạt giúp các nhà phát triển dễ dàng mở rộng quy mô đào tạo, xác thực từng giai đoạn và điều chỉnh quy trình làm việc cho các dự án của riêng họ. Điều này nhắc nhở chúng ta về tầm quan trọng của cộng đồng và các công cụ dễ tiếp cận đối với sự tiến bộ thực sự trong lĩnh vực thị giác máy tính.
Ở phía bên kia của quang phổ, các diễn giả kêu gọi khán giả suy nghĩ về vai trò rộng lớn hơn của AI trong xã hội. Trong bài phát biểu chính của mình, Gerd Leonhard , nhà tương lai học, nhà nhân văn và CEO của The Futures Agency, lập luận rằng "công nghệ trung lập về mặt đạo đức cho đến khi chúng ta sử dụng nó", nhấn mạnh rằng câu hỏi thực sự không chỉ là AI có thể làm gì, mà là nó nên làm gì. Ông cảnh báo không nên rơi vào những cạm bẫy như chủ nghĩa giản lược và sự thiếu chân thật, đồng thời kêu gọi một AI thực sự phục vụ lợi ích lâu dài của nhân loại.
Trọng tâm về trách nhiệm này tiếp tục được thể hiện trong buổi trò chuyện bên lò sưởi với Carissa Véliz từ Đại học Oxford, người đã nhấn mạnh đến quyền riêng tư và bảo mật. Bà chỉ ra rằng các cộng đồng nguồn mở rất quan trọng trong việc kiểm tra và cải thiện mã nguồn, và đạo đức và thiết kế là không thể tách rời. Thông điệp của bà rất rõ ràng: các nhà phát triển cần lường trước việc lạm dụng và xây dựng các hệ thống đặt nhân phẩm và phúc lợi xã hội lên hàng đầu.
Không chỉ dừng lại ở các buổi tọa đàm và trình diễn, YV25 còn tạo không gian kết nối cho mọi người. Trong giờ nghỉ giải lao và ăn trưa, những người tham dự đã giao lưu, chia sẻ kinh nghiệm, so sánh các phương pháp và khơi nguồn cho những hợp tác mới.
Đối với đội ngũ Ultralytics , đây cũng là một cơ hội tuyệt vời để gặp gỡ trực tiếp. Với các thành viên trải rộng khắp thế giới, những khoảnh khắc như thế này giúp củng cố mối quan hệ và cùng nhau ăn mừng những tiến bộ.
Ngày hội kết thúc bằng một buổi tiệc sau sự kiện, nơi những người tham dự có cơ hội thư giãn và tiếp tục giao lưu. Đây là khoảnh khắc để suy ngẫm, nạp lại năng lượng và hướng tới chương tiếp theo của sự đổi mới trong Vision AI.
YOLO Vision 2025 là một sự kiện tôn vinh ý tưởng, đổi mới và cộng đồng. Sự ra mắt của Ultralytics YOLO26 đã tạo tiền đề, tiếp theo là các buổi thảo luận sôi nổi về triển khai biên và AI lấy con người làm trung tâm, nhấn mạnh sự phát triển nhanh chóng của Vision AI và tác động ngày càng tăng của nó đối với thế giới.
Bên cạnh các phiên thảo luận chính, sự kiện còn kết nối mọi người. Các nhà nghiên cứu, nhà phát triển và những người đam mê đã chia sẻ kinh nghiệm, khơi nguồn những cuộc trò chuyện ý nghĩa và khám phá những tiềm năng mới cho tương lai. Sự kiện kết thúc tốt đẹp, với sự hào hứng của những người tham dự về tương lai của các mô hình YOLO và thị giác máy tính của Ultralytics.
Bạn đã sẵn sàng khám phá AI chưa? Hãy tham gia cộng đồng và kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI và thị giác máy tính. Truy cập trang giải pháp của chúng tôi để khám phá thêm các ứng dụng của thị giác máy tính trong nông nghiệp và AI trong robot . Hãy xem qua các tùy chọn cấp phép của chúng tôi và bắt đầu với thị giác máy tính ngay hôm nay!