敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

成为一名计算机视觉工程师

Ultralytics 团队

4 分钟阅读

2022 年 11 月 15 日

与 Ultralytics 一起探索计算机视觉 AI 的变革力量。了解行业应用,并向 Muhammad Rizwan Munawar 等专家工程师学习。

计算机视觉 (CV) 是人工智能的一个领域,它训练计算机解释和理解视觉世界。这项技术的工作方式与人类的视觉非常相似,但有一些明显的差异:人类需要终生的环境来训练如何区分物体、它们有多远、它们是否在移动以及图像是否存在问题。

CV 技术不仅使计算机能够可视化图像,还能够提取图像的信息或目的,例如确定传入物体的距离和运动。由于人工智能的进步以及深度学习和神经网络的创新,近年来该领域取得了巨大的飞跃,并且在某些与检测和标记对象相关的任务中已经超越了人类。

CV 为医疗行业等行业提供了现实世界的解决方案,例如,它对于诊断实施非常有用。但是,CV 的实用性也扩展到许多其他应用,例如体育、零售、农业、运输、制造等。在 Ultralytics,我们让每个人都可以访问训练模型和机器学习。我们的目标是帮助您利用人工智能的力量,而不必担心所有技术细节。从我们的努力中,我们已经看到甚至中学生也开始使用 Ultralytics HUBYOLOv5 训练他们的模型。

“计算机视觉是深度学习和人工智能领域最引人注目的成果之一。深度学习对计算机视觉领域的贡献确实使该领域与众不同。”

Wayne Thompson,SAS 数据科学家

CV 工程师应用视觉 AI 和机器学习研究来解决现实世界的问题。CV 工程师通常在各种系统方面拥有丰富的经验,例如图像识别、机器学习、边缘 AI、网络和通信、深度学习、人工智能、高级计算、图像注释、数据科学以及图像/视频分割。因此,事不宜迟,我们想向您介绍一位计算机视觉工程师并分享他的经验。

认识 Muhammad!

Muhammad Rizwan Munawar

Muhammad Rizwan Munawar 是一位计算机视觉工程师。他已在 COMSATS University Islamabad, Wah Campus 完成了计算机科学学士学位,并以人工智能作为专业领域。他的专长不仅限于视觉领域,因为他知道额外的技能可以帮助他成长并提升他的职业生涯,因此他还掌握桌面应用程序、Web 前端和有吸引力的仪表板开发知识。目前,他是一名自由职业者,根据客户的需求开发不同用例的解决方案。

您是如何进入机器学习和视觉 AI 领域的?

“嗯,这一路走来充满了挑战和持续的努力。刚开始时,我甚至不了解目标检测,但我对视觉 AI 充满好奇和热情。我开始做自由职业时,正值大学最后一年,目的只是为了学习技能。与此同时,我也开始通过各种 YouTube 频道学习基本的机器学习概念。在持续工作了 7-8 个月后,我对视觉 AI 和深度学习有了很好的理解,并决定在计算机视觉领域继续我的职业生涯。”

请和我们分享一下您使用 YOLOv5 的经验!

“我从 YOLOv5 发布以来就开始使用它,但为了根据不同的用例进行适当的开发和修改,我已经使用 YOLOv5 一年半了。”“最初,我处理的问题与目标检测有关,所以我开始探索与目标检测相关的不同算法。在花了一些时间研究后,我比较了不同目标检测器的 map 值,发现当时 YOLOv5 在 COCO 数据集上的准确率与其他目标检测器相比非常高。因此,我标记了我的数据,并在我的自定义数据上对 YOLOv5 进行了微调,目的是检测人。”“YOLOv5 非常易于使用、修改和微调,而且它庞大的社区随时可以提供帮助,以解决遇到的问题。YOLOv5 的定期更新使我能够以非常有效的方式进行目标检测。”    

Muhammad 给初学者的 3 个建议

  1. 定期学习新概念,并保持日常工作的连贯性。Muhammad 认为连贯性是他成功的最大因素之一。
  2. 不断思考新的想法,即使它们看起来很愚蠢也没关系!它们会帮助你深入思考问题。尝试在一定程度上实施这些想法,并将它们记录在一些文档中。始终遵循这个策略。
  3. 开发与计算机视觉相关的项目。定期从事项目将帮助你学习,并在你的脑海中培养对计算机视觉领域的热情。

感谢您阅读 Muhammad 的经历!如果您想了解更多关于他的工作,请查看他的网站。并且,为了及时了解我们与您分享的最新 YOLOv5 和视觉 AI 新闻,请在 TwitterLinkedin 上关注我们!  

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板