Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Trở thành Kỹ sư Thị giác Máy tính

Nhóm Ultralytics

4 phút đọc

15 tháng 11, 2022

Khám phá sức mạnh biến đổi của AI thị giác máy tính với Ultralytics. Tìm hiểu các ứng dụng trong ngành và học hỏi từ các kỹ sư chuyên gia như Muhammad Rizwan Munawar.

Thị giác máy tính (CV) là một lĩnh vực của trí tuệ nhân tạo, huấn luyện máy tính để diễn giải và hiểu thế giới hình ảnh. Công nghệ này hoạt động tương tự như thị giác của con người, nhưng có một vài điểm khác biệt đáng chú ý: con người có cả đời kinh nghiệm để huấn luyện cách phân biệt các vật thể, khoảng cách của chúng, liệu chúng có đang di chuyển hay không và liệu có điều gì đó không ổn với hình ảnh hay không.

Công nghệ CV liên quan đến việc máy tính không chỉ có thể hiển thị hình ảnh mà còn trích xuất thông điệp hoặc mục đích của hình ảnh, chẳng hạn như xác định khoảng cách và chuyển động của các vật thể đang đến. Nhờ những tiến bộ trong trí tuệ nhân tạo và những đổi mới trong học sâu và mạng nơ-ron, lĩnh vực này đã có thể có những bước tiến vượt bậc trong những năm gần đây và đã có thể vượt qua con người trong một số nhiệm vụ liên quan đến việc phát hiện và dán nhãn đối tượng.

CV cho phép các giải pháp thực tế cho các ngành công nghiệp như ngành y tế, ví dụ, nơi nó cực kỳ hữu ích cho các ứng dụng chẩn đoán. Tuy nhiên, tính hữu dụng của CV cũng mở rộng sang nhiều ứng dụng khác, chẳng hạn như thể thao, bán lẻ, nông nghiệp, vận tải, sản xuất, v.v. Tại Ultralytics, chúng tôi giúp mọi người có thể tiếp cận việc huấn luyện mô hình và máy học. Mục tiêu của chúng tôi là giúp bạn tận dụng sức mạnh của Trí tuệ nhân tạo mà không phải lo lắng về tất cả các chi tiết kỹ thuật. Từ những nỗ lực của mình, chúng tôi đã thấy ngay cả học sinh trung học cơ sở cũng bắt đầu huấn luyện mô hình của mình với Ultralytics HUBYOLOv5.

"Thị giác máy tính là một trong những điều đáng chú ý nhất xuất hiện từ thế giới học sâu và trí tuệ nhân tạo. Những tiến bộ mà học sâu đã đóng góp cho lĩnh vực thị giác máy tính thực sự đã tạo nên sự khác biệt cho lĩnh vực này."

Wayne Thompson, Chuyên gia Khoa học Dữ liệu của SAS

Các kỹ sư CV áp dụng AI thị giác và nghiên cứu máy học để giải quyết các vấn đề trong thế giới thực. Các kỹ sư CV thường có nhiều kinh nghiệm với các hệ thống khác nhau, chẳng hạn như nhận dạng hình ảnh, máy học, AI biên, mạng và truyền thông, học sâu, trí tuệ nhân tạo, điện toán tiên tiến, chú thích hình ảnh, khoa học dữ liệu và phân đoạn hình ảnh/video. Vì vậy, không cần phải dài dòng nữa, chúng tôi xin giới thiệu với bạn một kỹ sư thị giác máy tính và chia sẻ kinh nghiệm của anh ấy.

Gặp gỡ Muhammad!

Muhammad Rizwan Munawar

Muhammad Rizwan Munawar là một Kỹ sư Thị giác Máy tính. Ông đã hoàn thành bằng cử nhân Khoa học Máy tính với chuyên ngành Trí tuệ Nhân tạo từ Đại học COMSATS Islamabad, Cơ sở Wah. Chuyên môn của ông không giới hạn trong lĩnh vực thị giác, vì ông biết rằng các kỹ năng bổ sung có thể giúp ông phát triển và nâng cao sự nghiệp của mình, vì vậy ông cũng có kiến thức về các ứng dụng máy tính để bàn, giao diện người dùng web và phát triển bảng điều khiển hấp dẫn. Hiện tại, ông làm việc với tư cách là một người làm tự do phát triển các giải pháp cho các trường hợp sử dụng khác nhau dựa trên nhu cầu của khách hàng.

Bạn đã tham gia vào lĩnh vực máy học và AI thị giác như thế nào?

"Chà, đó là một hành trình đầy rẫy những trở ngại và sự chăm chỉ liên tục. Khi tôi bắt đầu, tôi thậm chí còn không biết về phát hiện đối tượng, nhưng tôi tò mò và đam mê chủ yếu về AI thị giác. Tôi đang học năm cuối cấp khi bắt đầu làm việc tự do, chỉ để học các kỹ năng. Song song đó, tôi cũng bắt đầu học các khái niệm cơ bản về học máy từ nhiều kênh YouTube khác nhau. Sau 7-8 tháng làm việc liên tục, tôi đã phát triển sự hiểu biết tốt về AI thị giác và học sâu và quyết định tiếp tục sự nghiệp chuyên nghiệp của mình trong lĩnh vực CV."

Hãy cho chúng tôi biết về trải nghiệm của bạn với YOLOv5!

"Tôi đã sử dụng YOLOv5 kể từ khi nó được phát hành, nhưng để phát triển và sửa đổi phù hợp với các trường hợp sử dụng khác nhau, tôi đã sử dụng YOLOv5 trong 1,5 năm.""Ban đầu, vấn đề tôi gặp phải liên quan đến phát hiện đối tượng, vì vậy tôi bắt đầu khám phá các thuật toán khác nhau liên quan đến phát hiện đối tượng. Sau khi dành thời gian nghiên cứu, tôi đã so sánh bản đồ cho các trình phát hiện đối tượng khác nhau và nhận ra độ chính xác của YOLOv5 trên bộ dữ liệu coco rất cao so với các trình phát hiện đối tượng khác vào thời điểm đó. Vì vậy, tôi đã gắn nhãn dữ liệu của mình và tinh chỉnh YOLOv5 trên dữ liệu tùy chỉnh của mình, với mục đích phát hiện người."YOLOv5 rất dễ sử dụng, sửa đổi và tinh chỉnh, đồng thời cộng đồng lớn của nó luôn sẵn sàng trợ giúp nếu ai đó gặp phải sự cố. Các bản cập nhật thường xuyên của YOLOv5 giúp tôi dễ dàng hơn mỗi ngày để thực hiện phát hiện đối tượng một cách rất hiệu quả."    

3 lời khuyên của Muhammad dành cho người mới bắt đầu

  1. Thường xuyên học các khái niệm mới và làm cho thói quen của bạn nhất quán. Muhammad cho rằng tính nhất quán là một trong những yếu tố lớn nhất dẫn đến thành công của anh.
  2. Hãy tiếp tục suy nghĩ về những ý tưởng mới, không quan trọng nếu chúng ngớ ngẩn! Chúng sẽ giúp bạn suy nghĩ về mọi thứ một cách sâu sắc. Cố gắng thực hiện những ý tưởng này ở một mức độ nhất định và viết chúng ra trong một số tài liệu. Luôn tuân theo chiến lược này.
  3. Phát triển các dự án liên quan đến CV. Thường xuyên thực hiện các dự án sẽ giúp bạn học hỏi và phát triển niềm đam mê với lĩnh vực CV.

Cảm ơn bạn đã đọc về hành trình của Muhammad! Nếu bạn muốn tìm hiểu thêm về công việc của anh ấy, hãy xem trang web của anh ấy. Và, để luôn cập nhật khi chúng tôi chia sẻ những tin tức mới nhất về YOLOv5 và AI thị giác với bạn, hãy theo dõi chúng tôi trên TwitterLinkedin!  

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard