计算机视觉(Computer Vision)是指运用摄影机代替人眼,通过对生物视觉的模拟来识别、跟踪、测量目标,在通过计算机的进一步处理后,最终将目标处理成更适合人眼观察或符合机器检测的图像。通俗来说,就是一门研究怎么让机器学习“看”的科学。
计算机视觉的前世今生
计算机视觉这门科学诞生于上世纪50年代,诞生之初的学科分类十分混乱,经过了几年摸索和发展,终于在60年代才有了第一次小高潮,MIT的Roberts通过计算机从数字图像中提取了各种三维结构,开创了三维计算机视觉研究。随着计算机技术的发展和研究人员不断的探索,80年代的计算机视觉终于趋于繁荣,从实验室走向了实际运用,也留下了受用至今的宝贵经验和知识。
计算机视觉技术主要的应用领域是物理机器人行业,而随着人工智能技术的逐渐成熟,现在的计算机视觉技术也随之融入了更多人工智能产品中,与流程自动化领域的结合也更为紧密了——对许多企业来说这显然是一个重大的利好消息。
流程自动化领域的技术运用
流程自动化领域与计算机视觉的图像分类和图像检测技术的关系可谓密不可分。图像分类通常与OCR技术结合使用。
那么什么是OCR技术呢?OCR即所谓的光学字符识别(Optical Character Recognition),能通过电子设备扫描件上亮、暗的模式确定文字的形状,然后将形状翻译成文字。简单来说,图像分类能与OCR技术结合后能找到某类图像的独有属性然后将其作为特征,以此通过人工智能算法将图像分类,比如从一堆发票中找出哪些是普通票据,哪些是增值税票据。
而图像检测则是指对图像中的对象进行识别,以识别不同模式中的对象。图像检测和图像分类的不同在于图像分类描述图片整体,而图像检测则关心具体特征。在自动化领域中如果在视频或图像中检测到目标,就会触发自动化处理。
RPA技术与计算机视觉的结合
RPA(Robotic process automation),指通过模拟人类在软件系统中的交互动作,自动执行那些基于规则、重复的业务流程,达到提升工作效率、减少人力成本的目的。RPA可以通过连接各种应用程序来实现自动化。RPA机器人更像是虚拟助理,让你卸下那些不复杂但耗费员工宝贵时间的重复性任务。
计算机视觉与RPA结合就可以帮助员工省下大把时间和精力:RPA借助计算机视觉技术不必通过键盘输入,也不必担心产生输入错误,其工作速度也远高于普通的员工。这样的结合将为无数需要大量处理文本的行业带来福音。
结合RPA技术的优越性
准确性:最大限度地减少人为错误及其相关成本
合规性:创建审计跟踪并严格遵守监管规则
速度:完成任务快4-5倍,提高效率
可靠性:机器人随时可用,24小时工作,最大限度地减少延迟
提高员工士气:让员工从重复性的工作中解放出来,这样他们就可以专注于生产力,而不是流程。
未来已来
自1956年首次提出人工智能这个概念来,人工智能的发展已经过了整整一个甲子有余,计算机视觉技术也从开始单纯的人脸识别和光学字符识别扩展到了各种方向,在安防、金融、互联网、医疗影像方面都开始逐步实现技术的应用。据Frost & Sullivan(弗诺斯特沙利文咨询公司)的统计数据显示,在2016年的时候,我国计算机视觉市场规模还只有11.4亿元。而到2019年,中国计算机视觉行业市场规模已经迅速增长至219.6亿元。另外,根据信通院统计数据,较2016年增长了惊人的259.6%。
随着视觉人工智能技术的逐渐成熟及应用领域的逐步扩大,预计2020年中国视觉人工智能市场规模将进一步扩大,达到755.5亿元。
可以预想的是,未来计算机视觉技术必将持续高速发展。