Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Trở thành Kỹ sư Thị giác Máy tính

Ultralytics Đội

4 phút đọc

15 tháng 11, 2022

Khám phá sức mạnh biến đổi của AI thị giác máy tính với Ultralytics . Khám phá các ứng dụng trong ngành và học hỏi từ các kỹ sư chuyên gia như Muhammad Rizwan Munawar.

Thị giác máy tính (CV) là một lĩnh vực của trí tuệ nhân tạo, huấn luyện máy tính để diễn giải và hiểu thế giới hình ảnh. Công nghệ này hoạt động tương tự như thị giác của con người, nhưng có một vài điểm khác biệt đáng chú ý: con người có cả đời kinh nghiệm để huấn luyện cách phân biệt các vật thể, khoảng cách của chúng, liệu chúng có đang di chuyển hay không và liệu có điều gì đó không ổn với hình ảnh hay không.

Công nghệ CV liên quan đến việc máy tính không chỉ có thể hiển thị hình ảnh mà còn trích xuất thông điệp hoặc mục đích của hình ảnh, chẳng hạn như xác định khoảng cách và chuyển động của các vật thể đang đến. Nhờ những tiến bộ trong trí tuệ nhân tạo và những đổi mới trong học sâu và mạng nơ-ron, lĩnh vực này đã có thể có những bước tiến vượt bậc trong những năm gần đây và đã có thể vượt qua con người trong một số nhiệm vụ liên quan đến việc phát hiện và dán nhãn đối tượng.

CV cho phép các giải pháp thực tế cho các ngành công nghiệp như y tế, chẳng hạn, nơi nó cực kỳ hữu ích cho việc triển khai chẩn đoán . Tuy nhiên, tiện ích của CV cũng mở rộng sang nhiều ứng dụng khác, chẳng hạn như thể thao, bán lẻ, nông nghiệp, vận tải, sản xuất, v.v. Tại Ultralytics Chúng tôi giúp mọi người dễ dàng tiếp cận các mô hình đào tạo và học máy. Mục tiêu của chúng tôi là giúp bạn tận dụng sức mạnh của Trí tuệ Nhân tạo mà không cần phải lo lắng về các chi tiết kỹ thuật. Nhờ những nỗ lực của mình, chúng tôi đã chứng kiến ngay cả học sinh trung học cơ sở cũng bắt đầu đào tạo mô hình của mình bằng Ultralytics HUBYOLOv5 .

"Thị giác máy tính là một trong những điều đáng chú ý nhất xuất hiện từ thế giới học sâu và trí tuệ nhân tạo. Những tiến bộ mà học sâu đã đóng góp cho lĩnh vực thị giác máy tính thực sự đã tạo nên sự khác biệt cho lĩnh vực này."

Wayne Thompson, Chuyên gia Khoa học Dữ liệu của SAS

Các kỹ sư CV áp dụng AI thị giác và nghiên cứu máy học để giải quyết các vấn đề trong thế giới thực. Các kỹ sư CV thường có nhiều kinh nghiệm với các hệ thống khác nhau, chẳng hạn như nhận dạng hình ảnh, máy học, AI biên, mạng và truyền thông, học sâu, trí tuệ nhân tạo, điện toán tiên tiến, chú thích hình ảnh, khoa học dữ liệu và phân đoạn hình ảnh/video. Vì vậy, không cần phải dài dòng nữa, chúng tôi xin giới thiệu với bạn một kỹ sư thị giác máy tính và chia sẻ kinh nghiệm của anh ấy.

Gặp gỡ Muhammad!

Muhammad Rizwan Munawar

Muhammad Rizwan Munawar là một Kỹ sư Thị giác Máy tính. Ông đã hoàn thành bằng cử nhân Khoa học Máy tính với chuyên ngành Trí tuệ Nhân tạo từ Đại học COMSATS Islamabad, Cơ sở Wah. Chuyên môn của ông không giới hạn trong lĩnh vực thị giác, vì ông biết rằng các kỹ năng bổ sung có thể giúp ông phát triển và nâng cao sự nghiệp của mình, vì vậy ông cũng có kiến thức về các ứng dụng máy tính để bàn, giao diện người dùng web và phát triển bảng điều khiển hấp dẫn. Hiện tại, ông làm việc với tư cách là một người làm tự do phát triển các giải pháp cho các trường hợp sử dụng khác nhau dựa trên nhu cầu của khách hàng.

Bạn đã tham gia vào lĩnh vực máy học và AI thị giác như thế nào?

"Chà, đó là một hành trình đầy rẫy những trở ngại và sự chăm chỉ liên tục. Khi tôi bắt đầu, tôi thậm chí còn không biết về phát hiện đối tượng, nhưng tôi tò mò và đam mê chủ yếu về AI thị giác. Tôi đang học năm cuối cấp khi bắt đầu làm việc tự do, chỉ để học các kỹ năng. Song song đó, tôi cũng bắt đầu học các khái niệm cơ bản về học máy từ nhiều kênh YouTube khác nhau. Sau 7-8 tháng làm việc liên tục, tôi đã phát triển sự hiểu biết tốt về AI thị giác và học sâu và quyết định tiếp tục sự nghiệp chuyên nghiệp của mình trong lĩnh vực CV."

Hãy cho chúng tôi biết về kinh nghiệm của bạn với YOLOv5 !

"Tôi đã sử dụng YOLOv5 kể từ khi nó được phát hành, nhưng để phát triển và sửa đổi phù hợp theo các trường hợp sử dụng khác nhau, tôi đã sử dụng YOLOv5 trong 1,5 năm.""Ban đầu, vấn đề tôi gặp phải liên quan đến phát hiện vật thể, vì vậy tôi bắt đầu khám phá các thuật toán khác nhau liên quan đến phát hiện vật thể. Sau khi dành thời gian nghiên cứu, tôi đã so sánh bản đồ với các máy dò vật thể khác nhau và nhận ra độ chính xác của YOLOv5 trên tập dữ liệu coco rất cao khi so sánh với các máy dò vật thể khác tại thời điểm đó. Vì vậy, tôi đã dán nhãn dữ liệu của mình và tinh chỉnh YOLOv5 trên dữ liệu tùy chỉnh của tôi, với mục đích phát hiện mọi người." YOLOv5 rất dễ sử dụng, sửa đổi và tinh chỉnh và cộng đồng lớn của nó luôn sẵn sàng trợ giúp nếu ai đó gặp sự cố. Các bản cập nhật thường xuyên của YOLOv5 cung cấp cho tôi khả năng phát hiện đối tượng một cách dễ dàng và hiệu quả mỗi ngày."    

3 lời khuyên của Muhammad dành cho người mới bắt đầu

  1. Thường xuyên học các khái niệm mới và làm cho thói quen của bạn nhất quán. Muhammad cho rằng tính nhất quán là một trong những yếu tố lớn nhất dẫn đến thành công của anh.
  2. Hãy tiếp tục suy nghĩ về những ý tưởng mới, không quan trọng nếu chúng ngớ ngẩn! Chúng sẽ giúp bạn suy nghĩ về mọi thứ một cách sâu sắc. Cố gắng thực hiện những ý tưởng này ở một mức độ nhất định và viết chúng ra trong một số tài liệu. Luôn tuân theo chiến lược này.
  3. Phát triển các dự án liên quan đến CV. Thường xuyên thực hiện các dự án sẽ giúp bạn học hỏi và phát triển niềm đam mê với lĩnh vực CV.

Cảm ơn bạn đã đọc về hành trình của Muhammad! Nếu bạn muốn tìm hiểu thêm về công việc của ông, hãy truy cập trang web của ông . Và, để cập nhật những thông tin mới nhất, chúng tôi sẽ chia sẻ YOLOv5 và tin tức về AI tầm nhìn cùng bạn, hãy theo dõi chúng tôi trên TwitterLinkedin !  

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí