Trở thành kỹ sư thị giác máy tính
Khám phá sức mạnh chuyển đổi của AI thị giác máy tính với Ultralytics. Khám phá các ứng dụng trong ngành và học hỏi từ các kỹ sư chuyên gia như Muhammad Rizwan Munawar.

Thị giác máy tính (CV) là một lĩnh vực của trí tuệ nhân tạo giúp huấn luyện máy tính diễn giải và hiểu thế giới hình ảnh. Công nghệ này hoạt động tương tự như thị giác con người, nhưng có một vài điểm khác biệt đáng chú ý: con người có cả một đời kinh nghiệm để huấn luyện cách phân biệt các đối tượng, khoảng cách của chúng, liệu chúng có đang di chuyển hay không và liệu có điều gì bất thường trong một hình ảnh hay không.
Công nghệ CV liên quan đến việc máy tính không chỉ có khả năng hình ảnh hóa các bức ảnh, mà còn trích xuất thông điệp hoặc mục đích của hình ảnh đó, chẳng hạn như xác định khoảng cách và chuyển động của các đối tượng đang tiến tới. Nhờ những tiến bộ trong trí tuệ nhân tạo và các đổi mới trong deep learning và mạng thần kinh, lĩnh vực này đã có những bước tiến vượt bậc trong những năm gần đây và đã có thể vượt qua con người trong một số tác vụ liên quan đến phát hiện và dán nhãn đối tượng.

CV hỗ trợ các giải pháp thực tiễn cho nhiều ngành công nghiệp như y tế, chẳng hạn như ứng dụng cực kỳ hữu ích trong triển khai chẩn đoán. Tuy nhiên, tiện ích của CV còn mở rộng ra vô số ứng dụng khác như thể thao, bán lẻ, nông nghiệp, vận tải, sản xuất và nhiều lĩnh vực khác. Tại Ultralytics, chúng tôi giúp cho việc huấn luyện các model và học máy trở nên dễ dàng tiếp cận với tất cả mọi người. Mục tiêu của chúng tôi là giúp bạn tận dụng sức mạnh của trí tuệ nhân tạo mà không cần phải lo lắng về tất cả các chi tiết kỹ thuật. Từ những nỗ lực của mình, chúng tôi thậm chí đã thấy cả các học sinh trung học cơ sở bắt đầu huấn luyện model của riêng mình với Ultralytics Platform và YOLOv5.
“Thị giác máy tính là một trong những điều đáng kinh ngạc nhất xuất hiện từ thế giới deep learning và trí tuệ nhân tạo. Những tiến bộ mà deep learning mang lại cho lĩnh vực thị giác máy tính thực sự đã tạo nên sự khác biệt cho lĩnh vực này.”
Wayne Thompson, Nhà khoa học dữ liệu tại SAS
Các kỹ sư CV áp dụng nghiên cứu về vision AI và học máy để giải quyết các vấn đề thực tế. Các kỹ sư CV thường có bề dày kinh nghiệm với nhiều hệ thống khác nhau như nhận diện hình ảnh, học máy, edge AI, mạng và truyền thông, deep learning, trí tuệ nhân tạo, tính toán nâng cao, chú thích hình ảnh, khoa học dữ liệu và phân đoạn hình ảnh/video. Vì vậy, không để bạn chờ đợi lâu hơn nữa, chúng tôi muốn giới thiệu với bạn một kỹ sư thị giác máy tính và chia sẻ kinh nghiệm của anh ấy.
Link to this sectionGặp gỡ Muhammad!#

Muhammad Rizwan Munawar là một Kỹ sư thị giác máy tính. Anh đã hoàn thành bằng cử nhân Khoa học Máy tính chuyên ngành Trí tuệ nhân tạo tại Đại học COMSATS Islamabad, Cơ sở Wah. Chuyên môn của anh không chỉ giới hạn trong lĩnh vực thị giác, vì anh biết rằng những kỹ năng bổ sung có thể giúp anh phát triển và thăng tiến trong sự nghiệp, nên anh cũng có kiến thức về ứng dụng máy tính để bàn, web front-end và phát triển dashboard hấp dẫn. Hiện tại, anh đang làm freelance phát triển các giải pháp cho các tình huống sử dụng khác nhau dựa trên nhu cầu của khách hàng.
Link to this sectionLàm thế nào bạn bắt đầu với học máy và vision AI?#
"Chà, đó là một hành trình đầy rào cản và nỗ lực làm việc chăm chỉ không ngừng nghỉ. Khi mới bắt đầu, tôi thậm chí còn chưa biết gì về phát hiện đối tượng, nhưng tôi tò mò và đam mê chủ yếu với vision AI. Tôi đang học năm cuối đại học thì bắt đầu làm freelance, chỉ để học hỏi các kỹ năng. Đồng thời, tôi cũng bắt đầu học các khái niệm học máy cơ bản từ nhiều kênh YouTube khác nhau. Sau 7-8 tháng làm việc liên tục, tôi đã phát triển được sự hiểu biết tốt về vision AI và deep learning và quyết định tiếp tục sự nghiệp chuyên nghiệp của mình trong lĩnh vực CV."
Link to this sectionHãy kể cho chúng tôi về kinh nghiệm của bạn với YOLOv5!#
"Tôi đã sử dụng YOLOv5 kể từ khi nó được phát hành, nhưng để phát triển và sửa đổi phù hợp cho các tình huống sử dụng khác nhau, tôi đã sử dụng YOLOv5 được 1,5 năm." "Ban đầu, vấn đề tôi đang giải quyết liên quan đến phát hiện đối tượng, vì vậy tôi bắt đầu khám phá các thuật toán khác nhau liên quan đến phát hiện đối tượng. Sau một thời gian nghiên cứu, tôi đã so sánh mAP cho các trình phát hiện đối tượng khác nhau và nhận ra độ chính xác của YOLOv5 trên tập dữ liệu COCO là rất cao khi so sánh với các trình phát hiện đối tượng khác vào thời điểm đó. Vì vậy, tôi đã dán nhãn dữ liệu của mình và tinh chỉnh YOLOv5 trên dữ liệu tùy chỉnh của mình với mục đích phát hiện con người." "YOLOv5 rất dễ sử dụng, sửa đổi và tinh chỉnh, và cộng đồng lớn của nó luôn sẵn sàng giúp đỡ nếu ai đó gặp sự cố. Các bản cập nhật thường xuyên của YOLOv5 mang đến cho tôi sự dễ dàng mỗi ngày để thực hiện phát hiện đối tượng một cách rất hiệu quả."

Link to this section3 lời khuyên của Muhammad dành cho người mới bắt đầu#
- Thường xuyên học hỏi các khái niệm mới và duy trì thói quen nhất quán. Muhammad coi tính nhất quán là một trong những yếu tố quan trọng nhất dẫn đến thành công của anh ấy.
- Hãy luôn suy nghĩ về những ý tưởng mới, dù chúng có vẻ ngớ ngẩn cũng không sao! Chúng sẽ giúp bạn tư duy sâu sắc về mọi vấn đề. Hãy thử triển khai những ý tưởng này ở một mức độ nhất định và ghi chép lại vào tài liệu. Hãy luôn tuân theo chiến lược này.
- Phát triển các dự án liên quan đến CV. Làm việc thường xuyên trên các dự án sẽ giúp bạn học hỏi và phát triển niềm đam mê trong tâm trí đối với lĩnh vực CV.
Cảm ơn bạn đã đọc về hành trình của Muhammad! Nếu bạn muốn tìm hiểu thêm về công việc của anh ấy, hãy xem trang web của anh ấy. Và, để cập nhật những tin tức mới nhất về YOLOv5 và vision AI mà chúng tôi chia sẻ, hãy theo dõi chúng tôi trên Twitter và LinkedIn!






