Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Ultralytics YOLO

Đưa Ultralytics YOLO11 lên các thiết bị Apple thông qua CoreML

Xem cách dễ dàng đưa Ultralytics YOLO11 lên các thiết bị Apple với CoreML và kích hoạt các tác vụ thị giác máy tính ngoại tuyến nhanh chóng cho các ứng dụng iOS thời gian thực.

ABAbirami Vina
4 min read
Đưa Ultralytics YOLO11 lên các thiết bị Apple thông qua CoreML

Với việc Apple giới thiệu các tính năng như Apple Intelligence, rõ ràng là AI trên thiết bị đang trở thành một phần trọng tâm trong cách chúng ta sử dụng điện thoại. Đối với các nhà phát triển, sự thay đổi này đồng nghĩa với việc người dùng đang đón nhận các ứng dụng iOS tận dụng những khả năng như computer vision để mang lại trải nghiệm thông minh và phản hồi nhanh nhạy hơn.

Computer vision là một loại trí tuệ nhân tạo (AI) cho phép máy tính hiểu và phân tích thông tin thị giác, chẳng hạn như hình ảnh hoặc video. Trên thiết bị di động, nó có thể được sử dụng theo thời gian thực để phát hiện, phân loại và tương tác với các đối tượng thông qua camera của điện thoại. Các model Vision AI như Ultralytics YOLO11 có thể được huấn luyện tùy chỉnh để nhận diện các đối tượng cụ thể, tùy thuộc vào nhu cầu ứng dụng của bạn.

Tuy nhiên, YOLO11 không được thiết lập để chạy trên iOS ngay lập tức. Để triển khai YOLO11 trên iPhone hoặc các thiết bị Apple khác, đặc biệt là để sử dụng ngoại tuyến, nó cần được chuyển đổi sang định dạng được tối ưu hóa cho hệ sinh thái của Apple.

Đây chính xác là loại vấn đề mà CoreML được xây dựng để giải quyết. CoreML là framework machine learning của Apple, được xây dựng để chạy các model tại chỗ và tích hợp liền mạch vào các ứng dụng iOS và macOS. Tích hợp CoreML, được Ultralytics hỗ trợ, giúp việc xuất model của bạn để triển khai cục bộ trên iPhone trở nên dễ dàng.

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn cách xuất model YOLO11 của bạn sang định dạng CoreML. Chúng ta cũng sẽ khám phá các trường hợp sử dụng theo thời gian thực cho thấy lợi thế của việc chạy các model computer vision trực tiếp trên thiết bị iOS. Hãy cùng bắt đầu nhé!

Link to this sectionCoreML là gì?#

CoreML là một framework machine learning (ML) do Apple phát triển, cho phép các nhà phát triển tích hợp trực tiếp các model ML đã được huấn luyện vào các ứng dụng trên khắp hệ sinh thái của Apple, bao gồm iOS (iPhone và iPad), macOS (Mac), watchOS (Apple Watch) và tvOS (Apple TV). Nó được thiết kế để làm cho machine learning trở nên dễ tiếp cận và hiệu quả trên các thiết bị Apple bằng cách cho phép các model chạy trực tiếp trên thiết bị mà không cần kết nối internet.

Cốt lõi của CoreML là một định dạng model thống nhất hỗ trợ nhiều tác vụ AI như phân loại hình ảnh, phát hiện đối tượng, nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên. Framework này được tối ưu hóa để tận dụng tối đa phần cứng của Apple, sử dụng CPU (central processing unit), GPU (graphics processing unit) và ANE (Apple Neural Engine) để thực thi các model một cách nhanh chóng và hiệu quả.

CoreML hỗ trợ nhiều loại model và tương thích với các thư viện machine learning phổ biến, bao gồm TensorFlow, PyTorch, scikit-learn, XGBoost và LibSVM. Điều này giúp các nhà phát triển dễ dàng mang các khả năng ML tiên tiến vào các ứng dụng hàng ngày đồng thời đảm bảo chúng chạy mượt mà trên các thiết bị Apple.

CoreML hỗ trợ các model từ những framework AI phổ biến khác

Hình 1. CoreML hỗ trợ các model từ các framework AI phổ biến khác (Nguồn).

Link to this sectionCác tính năng chính của CoreML#

Dưới đây là một số tính năng chính giúp CoreML trở thành công cụ đáng tin cậy để tích hợp AI vào các ứng dụng Apple:

  • Tối ưu hóa model: CoreML hỗ trợ các kỹ thuật nén như lượng tử hóa (quantization) và cắt tỉa (pruning) để giảm kích thước model và cải thiện hiệu quả runtime.
  • Cá nhân hóa trên thiết bị: Framework ML của Apple hỗ trợ cá nhân hóa trên thiết bị, cho phép các model được huấn luyện và cập nhật cục bộ dựa trên tương tác của người dùng.
  • Dự đoán bất đồng bộ (Asynchronous predictions): Framework này cho phép ứng dụng của bạn chạy dự đoán ở chế độ nền, giữ cho giao diện người dùng mượt mà và phản hồi nhanh trong khi xử lý các tác vụ AI.
  • Multi-task learning: CoreML hỗ trợ các model có thể thực hiện nhiều tác vụ cùng lúc, như phát hiện đối tượng và nhận dạng văn bản trong cùng một hình ảnh.

Link to this sectionCách xuất YOLO11 sang định dạng CoreML#

Bây giờ chúng ta đã hiểu rõ hơn về framework CoreML, hãy cùng đi qua cách sử dụng tích hợp CoreML được Ultralytics hỗ trợ để xuất model YOLO11 sang định dạng CoreML.

Link to this sectionBước 1: Thiết lập môi trường của bạn#

Để truy cập các tính năng tích hợp do Ultralytics cung cấp, hãy bắt đầu bằng việc cài đặt gói Python của Ultralytics. Đây là một thư viện gọn nhẹ, dễ sử dụng giúp đơn giản hóa các tác vụ như huấn luyện, đánh giá, dự đoán và xuất các model Ultralytics YOLO.

Bạn có thể cài đặt gói Python của Ultralytics bằng cách chạy “pip install ultralytics” trong terminal dòng lệnh của bạn. Nếu bạn đang sử dụng môi trường như Jupyter Notebook hoặc Google Colab, hãy thêm dấu chấm than (!) trước lệnh: “!pip install ultralytics”.

Nếu bạn gặp bất kỳ vấn đề nào trong quá trình cài đặt hoặc khi xuất sang CoreML, hãy kiểm tra tài liệu chính thức của Ultralytics hoặc hướng dẫn về các vấn đề thường gặp để được trợ giúp.

Link to this sectionBước 2: Xuất YOLO11 sang CoreML#

Khi gói đã được cài đặt thành công, bạn đã sẵn sàng để tải một model YOLO11 và chuyển đổi nó sang định dạng CoreML.

Nếu bạn không chắc chắn nên sử dụng model YOLO11 tiền huấn luyện nào, bạn có thể khám phá loạt các model được hỗ trợ bởi Ultralytics. Mỗi model cung cấp sự cân bằng khác nhau về tốc độ, kích thước và độ chính xác, và bạn có thể chọn loại phù hợp nhất cho dự án của mình. Bạn cũng có thể sử dụng một model YOLO11 được huấn luyện tùy chỉnh nếu bạn đã huấn luyện trên tập dữ liệu của riêng mình.

Trong đoạn mã dưới đây, một tệp model YOLO11 tiền huấn luyện có tên "yolo11n.pt" được sử dụng. Trong quá trình xuất, nó được chuyển đổi thành một gói CoreML có tên "yolo11n.mlpackage."

Model "yolo11n" là phiên bản nano, được tối ưu hóa cho tốc độ và mức sử dụng tài nguyên thấp. Tùy thuộc vào nhu cầu của dự án, bạn cũng có thể chọn các kích thước model khác như "s" cho nhỏ, "m" cho trung bình, "l" cho lớn hoặc "x" cho cực lớn. Mỗi phiên bản cung cấp sự cân bằng khác nhau giữa hiệu suất và độ chính xác.

from ultralytics import YOLO

model = YOLO("yolo11n.pt")
model.export(format="coreml")

Link to this sectionBước 3: Chạy inference bằng model CoreML đã xuất#

Sau khi xuất sang định dạng CoreML, YOLO11 có thể dễ dàng được tích hợp vào các ứng dụng iOS, cho phép thực hiện các tác vụ computer vision thời gian thực như phát hiện đối tượng trên các thiết bị như iPhone, iPad và Mac.

Ví dụ, đoạn mã dưới đây minh họa cách tải model CoreML đã xuất và thực hiện inference. Inference là quá trình sử dụng một model đã được huấn luyện để đưa ra các dự đoán trên dữ liệu mới. Trong trường hợp này, model phân tích một hình ảnh gia đình đang chơi bóng.

coreml_model = YOLO("yolo11n.mlpackage")
results = coreml_model("https://images.pexels.com/photos/4933841/pexels-photo-4933841.jpeg", save=True)

Sau khi chạy mã, hình ảnh đầu ra sẽ được lưu trong thư mục "runs/detect/predict".

Sử dụng model YOLO11 đã xuất sang định dạng CoreML để phát hiện đối tượng

Hình 2. Sử dụng model YOLO11 đã xuất ở định dạng CoreML để phát hiện đối tượng. Hình ảnh do tác giả cung cấp.

Link to this sectionCác model CoreML đã xuất có thể được sử dụng ở đâu?#

Việc xuất YOLO11 sang CoreML mang lại sự linh hoạt để xây dựng các ứng dụng computer vision đa dạng có thể chạy hiệu quả trên iPhone, iPad và Mac. Tiếp theo, hãy xem xét một số kịch bản thực tế nơi sự tích hợp này có thể đặc biệt hữu ích.

Link to this sectionCác ứng dụng thực tế tăng cường (AR) và trò chơi được điều khiển bởi các model CoreML#

Thực tế tăng cường (AR) kết hợp nội dung kỹ thuật số với thế giới thực bằng cách phủ các phần tử ảo lên chế độ xem camera trực tiếp. Nó đang trở thành một phần quan trọng của trò chơi di động, tạo ra những trải nghiệm tương tác và nhập vai hơn.

Với YOLO11 được xuất sang định dạng CoreML, các nhà phát triển iOS có thể xây dựng các trò chơi AR nhận diện các đối tượng trong thế giới thực như ghế băng, cây cối hoặc biển báo bằng camera của điện thoại. Trò chơi sau đó có thể phủ các vật phẩm ảo, chẳng hạn như tiền xu, manh mối hoặc sinh vật lên trên các đối tượng này để nâng cao môi trường xung quanh của người chơi.

Ở hậu trường, điều này hoạt động bằng cách sử dụng phát hiện đối tượng và theo dõi đối tượng. YOLO11 phát hiện và nhận dạng đối tượng trong thời gian thực, trong khi việc theo dõi giữ cho các đối tượng đó luôn trong tầm nhìn khi camera di chuyển, đảm bảo các phần tử ảo vẫn được căn chỉnh với thế giới thực.

Người chơi có thể hướng điện thoại của họ, khám phá môi trường xung quanh và tương tác với những gì họ thấy để thu thập vật phẩm hoặc hoàn thành các thử thách nhanh. Tất cả những điều này có thể chạy trực tiếp trên thiết bị mà không cần kết nối internet, làm cho trải nghiệm trở nên mượt mà và hấp dẫn.

Link to this sectionCác ứng dụng iOS tích hợp các model CoreML cho ANPR thời gian thực#

Tự động nhận dạng biển số xe (ANPR) là một ứng dụng computer vision được sử dụng để phát hiện và đọc biển số xe. Nó thường được sử dụng trong các hệ thống an ninh, giám sát giao thông và kiểm soát truy cập. Với CoreML và các model như YOLO11, ANPR hiện có thể chạy hiệu quả trên các thiết bị iOS.

Việc sở hữu một ứng dụng ANPR trên iPhone có thể đặc biệt hữu ích trong các môi trường tập trung vào an ninh. Ví dụ, nó có thể giúp các đội nhanh chóng xác định xem một phương tiện đi vào khu vực hạn chế có được ủy quyền hay không.

Một ứng dụng như vậy có thể sử dụng model Vision AI như YOLO11, được tích hợp thông qua CoreML, để phát hiện các phương tiện và xác định vị trí biển số xe của chúng trong thời gian thực bằng camera của thiết bị. Sau khi biển số được phát hiện, công nghệ nhận dạng ký tự quang học (OCR) có thể đọc số biển số. Ứng dụng sau đó có thể so sánh con số này với một cơ sở dữ liệu cục bộ hoặc dựa trên đám mây để xác minh quyền truy cập hoặc gắn cờ các phương tiện không được phép.

Vision AI được sử dụng để phát hiện và đọc số biển kiểm soát

Hình 3. Vision AI có thể được sử dụng để phát hiện và đọc số biển số xe. (Nguồn).

Link to this sectionCác ứng dụng tập trung vào khả năng tiếp cận có thể tận dụng các model CoreML#

AI đã có tác động to lớn đến khả năng tiếp cận, giúp phá bỏ các rào cản cho người khiếm thị. Với các công cụ như CoreML và các model computer vision như YOLO11, các nhà phát triển có thể xây dựng các ứng dụng iOS mô tả thế giới xung quanh người dùng trong thời gian thực, giúp các tác vụ hàng ngày trở nên dễ dàng và độc lập hơn.

Ví dụ, một người khiếm thị có thể hướng camera iPhone của họ vào môi trường xung quanh. Ứng dụng sử dụng phát hiện đối tượng để nhận diện các phần tử chính, như phương tiện, con người hoặc biển báo đường phố và mô tả những gì nó nhìn thấy. Điều này có thể được sử dụng trong các tình huống như điều hướng trên đường phố đông đúc hoặc hiểu biết về tình trạng khẩn cấp.

Ví dụ về việc sử dụng YOLO11 để phát hiện người

Hình 4. Một ví dụ về việc sử dụng YOLO11 để phát hiện con người

Link to this sectionCác điểm chính cần lưu ý#

Việc xuất YOLO11 sang định dạng CoreML tạo ra những cơ hội mới cho các ứng dụng thời gian thực, bao gồm phát hiện đối tượng ngoại tuyến trên các thiết bị iOS. Từ nông nghiệp và an ninh đến khả năng tiếp cận, sự kết hợp này cho phép các nhà phát triển xây dựng các ứng dụng thông minh, hiệu quả và tập trung vào quyền riêng tư chạy hoàn toàn trên thiết bị.

Chỉ với một vài bước đơn giản, bạn có thể chuyển đổi model YOLO11 của mình và thêm các tính năng computer vision đáng tin cậy vào iPhone. Tuyệt vời nhất là nó hoạt động mà không cần kết nối internet. Nhìn chung, việc tích hợp CoreML mang sức mạnh của AI tiên tiến đến các ứng dụng di động hàng ngày, giúp chúng nhanh hơn, phản hồi tốt hơn và sẵn sàng chạy ở bất cứ đâu.

Bạn tò mò muốn tìm hiểu thêm về AI? Hãy khám phá GitHub repository của chúng tôi, kết nối với cộng đồng của chúng tôi và xem qua các tùy chọn cấp phép để khởi động dự án computer vision của bạn. Tìm hiểu cách các đổi mới như AI trong bán lẻcomputer vision trong logistics đang định hình tương lai trên các trang giải pháp của chúng tôi.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning