Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Ultralytics ' điểm nổi bật chính từ YOLO Tầm nhìn 2025!

Hãy tham gia cùng chúng tôi để tóm tắt lại Ultralytics 'sự kiện lớn nhất trong năm, giới thiệu Ultralytics Ra mắt YOLO26, các buổi thảo luận truyền cảm hứng và những điểm nổi bật quan trọng của cộng đồng.

Cộng đồng AI và thị giác máy tính đã cùng nhau tham gia YOLO Vision 2025 (YV25) vào ngày 25 tháng 9. Ultralytics 'Sự kiện Vision AI kết hợp thường niên. Được tổ chức tại London tại The Pelligon và phát trực tiếp trên toàn thế giới, sự kiện chào đón một nhóm đa dạng các nhà nghiên cứu, kỹ sư và những người đam mê AI đến chia sẻ ý tưởng và tìm hiểu về những đổi mới, chẳng hạn như Ultralytics YOLO26 .

Đánh dấu năm thứ tư, sự kiện tiếp tục phát triển về phạm vi tiếp cận và tác động. Livestream YV25 đã thu hút hơn 6.800 lượt xem, tạo ra hơn 49.000 lượt hiển thị và thu về gần 2.000 giờ xem.

YV25 bắt đầu với bài phát biểu khai mạc của người dẫn chương trình Oisin Lunny , người đã định hình không khí cho cả ngày bằng cách khuyến khích người tham dự kết nối, chia sẻ và tận hưởng tối đa sự kiện. Như anh ấy đã nói, “ YOLO Vision 2025 là hội nghị tập hợp cộng đồng AI thị giác nguồn mở để tập trung vào dữ liệu, máy học và những tiến bộ về thị giác máy tính.”

Trong bài viết này, chúng tôi sẽ tóm tắt những điểm nổi bật chính từ YOLO Tầm nhìn 2025, bao gồm lễ ra mắt sản phẩm, các bài phát biểu quan trọng, hội thảo chuyên đề, các buổi demo trực tiếp và những khoảnh khắc cộng đồng làm nên sự đặc biệt của ngày hôm đó. Hãy bắt đầu thôi!

Đi từ một GPU đến khoản tài trợ Series A trị giá 30 triệu đô la

Trước sự kiện, có rất nhiều sự phấn khích xung quanh việc ra mắt sản phẩm mới và Glenn Jocher, Người sáng lập kiêm Giám đốc điều hành của chúng tôi, đã bắt đầu ngày mới bằng cách xây dựng trên năng lượng đó. 

Anh ấy đã chia sẻ cuộc hành trình của Ultralytics , nhớ lại năm 2020, anh ấy đã chạy thử nghiệm trên một chiếc 1080 Ti duy nhất cắm vào MacBook của mình, một thiết lập đã lỗi thời ngày nay. Từ những khởi đầu khiêm tốn đó, Ultralytics đã phát triển thành một cộng đồng toàn cầu với hàng tỷ suy luận hàng ngày được hỗ trợ bởi YOLO các mô hình.

Glenn cũng đã nói về Ultralytics gần đây đã hoàn tất vòng gọi vốn Series A trị giá 30 triệu đô la . Ông giải thích khoản đầu tư này sẽ thúc đẩy giai đoạn tăng trưởng tiếp theo bằng cách cho phép công ty mở rộng quy mô đội ngũ, mở rộng nghiên cứu và đảm bảo các nguồn lực điện toán cần thiết để tiếp tục thúc đẩy ranh giới của thị giác máy tính. 

Ultralytics YOLO26: Tốt hơn, nhanh hơn, nhỏ hơn YOLO người mẫu

Glenn tiếp tục công bố hai nỗ lực mới từ Ultralytics . Đầu tiên là Ultralytics YOLO26, mẫu mới nhất trong Ultralytics YOLO gia đình, được thiết kế nhỏ hơn, nhanh hơn và hiệu quả hơn trong khi vẫn đạt được độ chính xác cao hơn. Thứ hai là Ultralytics Nền tảng, một không gian làm việc SaaS đầu cuối mới kết hợp dữ liệu, đào tạo, triển khai và giám sát để giúp việc xây dựng các giải pháp thị giác máy tính trở nên dễ dàng hơn bao giờ hết, dự kiến sẽ được công bố trong tương lai gần.

Hình 1. Glenn Jocher thông báo Ultralytics YOLO26 trên sân khấu tại YOLO Tầm nhìn 2025.

YOLO26 được xây dựng để thúc đẩy hiệu suất trong khi vẫn thiết thực cho việc sử dụng trong thế giới thực. Phiên bản nhỏ nhất đã chạy nhanh hơn tới 43% trên CPU đồng thời vẫn cải thiện độ chính xác, khiến nó trở nên lý tưởng cho các ứng dụng từ thiết bị di động đến các hệ thống doanh nghiệp lớn. YOLO26 sẽ được công khai vào cuối tháng 10.

Đây là cái nhìn sơ lược về các tính năng chính của YOLO26:

  • Kiến trúc được sắp xếp hợp lý: Mô-đun Distribution Focal Loss (DFL) đã bị loại bỏ, trước đây làm chậm các mô hình. YOLO26 hiện chạy hiệu quả hơn mà không làm giảm độ chính xác.
  • Dự đoán nhanh hơn : YOLO26 giới thiệu tùy chọn bỏ qua việc loại bỏ mức độ ức chế không tối đa ( NMS ) bước, cho phép cung cấp kết quả nhanh hơn và tạo điều kiện triển khai theo thời gian thực.
  • Phát hiện các vật thể nhỏ tốt hơn: Các phương pháp huấn luyện mới cải thiện tính ổn định và tăng đáng kể độ chính xác, đặc biệt là khi phát hiện các chi tiết nhỏ trong các cảnh phức tạp.
  • Huấn luyện thông minh hơn: Trình tối ưu hóa MuSGD mới kết hợp các điểm mạnh của hai kỹ thuật huấn luyện, giúp mô hình học nhanh hơn và đạt được độ chính xác cao hơn.

Cái nhìn đầu tiên về Ultralytics nền tảng

Sau khi giới thiệu YOLO26, Glenn đã mời Prateek Bhatnagar , Trưởng phòng Kỹ thuật Sản phẩm của chúng tôi, đến để trình diễn dự án tiếp theo sắp tới, Ultralytics Nền tảng. Được xây dựng để đơn giản hóa toàn bộ quy trình làm việc về thị giác máy tính, nền tảng này hướng đến mục tiêu tập hợp các tập dữ liệu, chú thích, đào tạo, triển khai và giám sát tại một nơi.

Prateek đã so sánh nó với việc điều chỉnh một chiếc xe hơi: thay vì đến các cửa hàng khác nhau để mua lốp xe, động cơ và hộp số, mọi thứ diễn ra trong một nhà để xe. Tương tự, nền tảng này cung cấp cho các nhà phát triển một không gian làm việc tích hợp để quản lý toàn bộ vòng đời của một mô hình AI thị giác.

Bản demo giới thiệu các công cụ chú giải hỗ trợ bởi AI giúp tăng tốc quá trình chuẩn bị bộ dữ liệu, các tùy chọn huấn luyện tùy chỉnh cho cả chuyên gia và người mới bắt đầu, và khả năng giám sát thời gian thực các lần chạy huấn luyện. 

Thông tin chi tiết từ một buổi thảo luận về triển khai biên

Một điểm nổi bật khác của YV25 là hội thảo về triển khai biên, do Oisin Lunny điều hành. Phiên họp có sự tham gia của Yuki Tsuji từ Sony Semiconductor Solutions, David Plowman từ Raspberry Pi và Glenn Jocher. 

Cuộc thảo luận đã khám phá cách di chuyển AI đến biên giúp giảm độ trễ, giảm chi phí và cải thiện quyền riêng tư. Yuki đã giới thiệu cảm biến IMX500 của Sony, có thể chạy suy luận trực tiếp trên chip. Trong khi đó, David đã nói về cách Raspberry Pi đang mở rộng từ nguồn gốc nhà sản xuất sang các ứng dụng thương mại quy mô lớn.

Hình 2. Một hội thảo về triển khai biên (edge deployment) với sự góp mặt của Oisin Lunny, Yuki Tsuji, David Plowman và Glenn Jocher.

Hội thảo cũng đề cập đến một trong những rào cản lớn nhất đối với các nhà phát triển: làm sao để các mô hình chạy mượt mà trên nhiều thiết bị khác nhau. Đây chính là nơi gói Python Ultralytics đóng vai trò then chốt. 

Với nhiều tùy chọn xuất dữ liệu, nó giúp việc chuyển đổi mô hình đã được đào tạo sang sản xuất trên thiết bị di động, hệ thống nhúng hoặc phần cứng doanh nghiệp trở nên dễ dàng. Bằng cách loại bỏ những khó khăn trong việc chuyển đổi mô hình, Ultralytics giúp các nhóm tập trung vào việc xây dựng giải pháp thay vì vật lộn với các vấn đề về khả năng tương thích.

Như David đã giải thích, “Tôi biết từ kinh nghiệm cay đắng của mình rằng việc chuyển đổi mô hình là điều kinh khủng, và nếu có người khác làm điều đó cho tôi, thì cuộc sống sẽ dễ dàng hơn rất nhiều. Đó là nơi Ultralytics thực sự cải thiện câu chuyện và cung cấp thứ gì đó có giá trị cho người dùng của chúng tôi.” 

Đẩy nhanh đổi mới và phần cứng AI

Những tiến bộ của phần mềm AI đang diễn ra song song với phần cứng và cùng nhau, chúng đang thúc đẩy một làn sóng đổi mới mới trong lĩnh vực thị giác máy tính. Trong khi các mô hình như Ultralytics YOLO tiếp tục nâng cao độ chính xác, tác động thực tế của chúng cũng phụ thuộc vào nền tảng mà chúng chạy trên đó.

Ví dụ, Seeed Studio đã giới thiệu phần cứng dạng mô-đun, giá rẻ như bo mạch reCamera và XIAO của họ, được tải sẵn Ultralytics YOLO Mô hình AI giúp các nhà phát triển dễ dàng chuyển từ nguyên mẫu sang hệ thống AI thực tế. Sự tích hợp phần cứng-phần mềm này giúp giảm rào cản gia nhập và cho thấy sự đổi mới ở cấp độ phần cứng trực tiếp thúc đẩy việc áp dụng.

Dưới đây là một số điểm chính rút ra từ các bài phát biểu quan trọng khác của YV25, nhấn mạnh cách thiết kế phối hợp phần cứng-phần mềm đang mở ra những khả năng mới:

  • Lượng tử hóa mở ra những bước tiến lớn về tốc độ : Intel cho thấy cách chuyển đổi Ultralytics YOLO các mô hình để OpenVINO với lượng tử hóa tăng cường suy luận từ 54 FPS lên 606 FPS chỉ trong 30 phút, làm nổi bật sức mạnh của tối ưu hóa.
  • Các công cụ đầy đủ giúp triển khai AI biên trở nên thiết thực: NVIDIA đã nêu bật cách các thiết bị Jetson, TensorRT , Triton Inference Server và DeepStream SDK phối hợp với nhau để hợp lý hóa việc triển khai AI thị giác hiệu suất cao ở biên.
  • Hệ sinh thái mở đẩy nhanh quá trình tạo mẫu: AMD nhấn mạnh nền tảng đầu cuối của mình được xây dựng trên GPU và ngăn xếp phần mềm ROCm, giúp các nhà phát triển chuyển nhanh chóng từ nguyên mẫu sang triển khai đồng thời kiểm soát chi phí.
  • Chip công suất thấp mở rộng phạm vi ứng dụng AI cho các thiết bị hạn chế: DEEPX đã giới thiệu bộ xử lý DX-M1 và DX-M2, cung cấp hàng chục TOPS dưới 5 watt để cho phép suy luận nâng cao trong các hệ thống nhỏ gọn, giới hạn về năng lượng.

Các xu hướng gần đây trong thị giác máy tính

Với những tiến bộ song hành trong cả phần mềm và phần cứng, thị giác máy tính đang phát triển nhanh hơn bao giờ hết. Sự phát triển song song này không chỉ cải thiện độ chính xác và tốc độ mà còn định hình cách AI thị giác có thể được triển khai trong thế giới thực. Tại YV25, những người tham gia đã có cơ hội lắng nghe từ các chuyên gia trong lĩnh vực robot, triển khai biên và AI đa phương thức, mỗi người đưa ra một góc nhìn khác nhau về hướng đi của lĩnh vực này.

Ví dụ, trong bài phát biểu quan trọng của mình, Michael Hart từ D-Robotics đã chứng minh cách ghép nối Ultralytics YOLO Các mô hình với bo mạch RDK X5 nhỏ gọn (một mô-đun thị giác AI nhúng nhỏ) cho phép robot chạy các mô hình thị giác tiên tiến theo thời gian thực. Buổi trình diễn trực tiếp của ông đã cho thấy robot đã phát triển đến mức nào, từ các thí nghiệm trong phòng thí nghiệm thành các hệ thống thực tế được hỗ trợ bởi AI.

Hình 3. Michael Hart nhấn mạnh cách robot hỗ trợ AI ngày nay phụ thuộc vào thị giác máy tính.

Tương tự, Alexis CrowellSteven Hunsche từ Axelera AI đã nhấn mạnh những thách thức và cơ hội của việc triển khai vision AI ở biên. Thông qua các bản demo trực tiếp, họ đã giải thích cách các Đơn vị xử lý AI (AIPU) Metis của Axelera AI kết hợp RISC-V và tính toán trong bộ nhớ kỹ thuật số để mang lại hiệu suất cao với mức tiêu thụ điện năng rất thấp. Được đóng gói trong các hệ số hình thức quen thuộc như M.2 và PCIe, thiết kế phần cứng-phần mềm kết hợp của nền tảng giúp mở rộng quy mô AI biên một cách thiết thực và hiệu quả.

Và trong một phiên họp khác, Merve Noyan từ Hugging Face Bà đã khám phá sự trỗi dậy của AI đa phương thức, trong đó các mô hình kết hợp hình ảnh với văn bản, âm thanh và các dữ liệu đầu vào khác. Bà đã chia sẻ về các trường hợp sử dụng, từ phân tích tài liệu đến các tác nhân hiện thân, đồng thời nhấn mạnh cách đổi mới nguồn mở đang thúc đẩy việc áp dụng AI.

Cân bằng tiến bộ kỹ thuật với các giá trị nhân văn

Bên cạnh những bài nói chuyện đầy cảm hứng về bức tranh toàn cảnh, YV25 còn bao gồm các buổi thực hành chuyên sâu. Jiri Borovec từ Lightning AI đã hướng dẫn thực hành cách huấn luyện và tinh chỉnh. Ultralytics YOLO các mô hình với PyTorch Sét và đa GPU ủng hộ. 

Ông trình bày các ví dụ về code và nhấn mạnh cách các công cụ mã nguồn mở, tài liệu rõ ràng và các framework linh hoạt giúp các nhà phát triển dễ dàng mở rộng quy mô huấn luyện, xác thực mọi giai đoạn và điều chỉnh quy trình làm việc cho các dự án của riêng họ. Đó là một lời nhắc nhở về tầm quan trọng của cộng đồng và các công cụ dễ tiếp cận đối với sự tiến bộ thực sự trong lĩnh vực thị giác máy tính.

Ở một khía cạnh khác, các diễn giả kêu gọi khán giả suy nghĩ về vai trò rộng lớn hơn của AI trong xã hội. Trong bài phát biểu quan trọng của mình, Gerd Leonhard, nhà tương lai học, nhà nhân văn học và Giám đốc điều hành của The Futures Agency, lập luận rằng "công nghệ mang tính trung lập về mặt đạo đức cho đến khi chúng ta sử dụng nó", nhấn mạnh rằng câu hỏi thực sự không chỉ là AI có thể làm gì, mà là nó nên làm gì. Ông cảnh báo về việc rơi vào những cạm bẫy như giản lược và thiếu trung thực, đồng thời kêu gọi AI thực sự phục vụ lợi ích lâu dài của nhân loại.

Hình 4. Gerd Leonhard chia sẻ những suy nghĩ của ông về việc xây dựng các giải pháp AI đồng thời giữ chúng lấy con người làm trung tâm.

Sự tập trung vào trách nhiệm này tiếp tục trong cuộc trò chuyện thân mật với Carissa Véliz từ Đại học Oxford, người nhấn mạnh đến quyền riêng tư và bảo mật. Bà chỉ ra rằng các cộng đồng mã nguồn mở rất quan trọng để kiểm tra và cải thiện mã, đồng thời đạo đức và thiết kế là không thể tách rời. Thông điệp của bà rất rõ ràng: các nhà phát triển cần dự đoán việc sử dụng sai mục đích và xây dựng các hệ thống đặt phẩm giá con người và phúc lợi xã hội lên hàng đầu.

Kết nối mạng ở London tại YV25

Vượt xa các bài nói chuyện và trình diễn, YV25 cũng tạo không gian cho mọi người kết nối. Trong giờ giải lao và ăn trưa, những người tham dự đã giao lưu, chia sẻ kinh nghiệm, so sánh các phương pháp tiếp cận và khơi dậy những hợp tác mới.

Đối với đội ngũ Ultralytics , đây cũng là một cơ hội tuyệt vời để gặp gỡ trực tiếp. Với các thành viên trải rộng khắp thế giới, những khoảnh khắc như thế này giúp củng cố mối quan hệ và cùng nhau ăn mừng những tiến bộ.

Hình 5. Các Ultralytics đội kết thúc một ngày đầy cảm hứng tại YOLO Tầm nhìn 2025.

Ngày hội khép lại với một bữa tiệc after-party, nơi những người tham gia có cơ hội thư giãn và tiếp tục kết nối. Đó là khoảnh khắc để suy ngẫm, nạp lại năng lượng và hướng tới chương tiếp theo của sự đổi mới trong Vision AI.

Cùng nhau vượt qua các giới hạn của Vision AI

YOLO Tầm nhìn 2025 là sự tôn vinh các ý tưởng, đổi mới và cộng đồng. Sự ra mắt của Ultralytics YOLO26 đã tạo tiền đề, tiếp theo là các cuộc thảo luận hấp dẫn về triển khai biên và AI lấy con người làm trung tâm, nhấn mạnh sự tiến bộ nhanh chóng của Vision AI và tác động ngày càng tăng của nó đối với thế giới.

Bên cạnh các phiên thảo luận chính, sự kiện còn mang mọi người đến gần nhau hơn. Các nhà nghiên cứu, nhà phát triển và những người đam mê đã chia sẻ kinh nghiệm, khơi nguồn những cuộc trò chuyện ý nghĩa và khám phá những khả năng mới cho tương lai. Sự kiện kết thúc tốt đẹp, với những người tham dự hào hứng về tương lai của... Ultralytics YOLO mô hình và thị giác máy tính.

Bạn đã sẵn sàng khám phá AI chưa? Tham gia cộng đồngkho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI và thị giác máy tính. Truy cập các trang giải pháp của chúng tôi để khám phá thêm các ứng dụng của thị giác máy tính trong nông nghiệpAI trong robot học. Kiểm tra các tùy chọn cấp phép của chúng tôi và bắt đầu với thị giác máy tính ngay hôm nay!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí