什么是IDP?
IDP英文全称是Intelligent Document Processing,又称智能文档处理,指使用机器学习(ML)、深度学习(DL)、计算机视觉(包括OCR/ICR)和自然语言技术(NLT),来从结构化和非结构化的文档(如发票、采购订单、年度报告、视频文件、音频、工作表、邮件等)中捕获或提取信息、以及对文档进行处理(比如合并、分割、校正文档,数据去噪、验证、标注、验证)等操作。
弘玑尚书台" alt="弘玑尚书台" border="0" vspace="0" width="817" height="384" style="width: 817px; height: 384px;"/>
IDP提供了自由文本+富媒体文件处理的能力,对于银行、证券、金融服务、医疗服务、保险、IT、电商、供应链等行业的数据利用、处理、分类、检索等能力大大提升。
IDP的技术原理是什么?
文档处理自动化一词并不新鲜,早期许多技术术语都有涉及,比如数据捕获、文档AI、捕获自动化等等。近年来,各企业对IDP的兴趣显著增加,主要是因为大量的语言模型被公开、商品化应用,导致技术壁垒逐渐减小。Gartner预估,智能文档处理市场,到2022年将达到48亿美元。
IDP技术主要由人工智能的进步推动,尤其是:
计算机视觉(CV):不仅可以识别基于打印文本和手写文本的字符,还能将文档分解成片段,为其中的内容提供上下文提示。
自然语言处理(NLP):不仅可以识别和提取字符里面的元素(例如:日期),还可以映射到数据模型中(例如:年/月/日)。
文本分析和知识图谱等高级AI功能:可以基于数据提供理解或建议。
IDP产品和其他文档处理产品的不同之处在于能够处理以前无法处理的格式,不仅可以处理为人类创建的文档,还可以处理为机器创建的文档,因此,可以将以前由人或者机器人完成的文档处理工作移交给IDP来完成。
什么是弘玑尚书台(IDP)?
弘玑尚书台,是弘玑基于先进AI识别/理解技术和RPA技术,打造的智能文档处理平台(IDP,Intelligent Document Processing),可实现纸质文书从识别、提取、纠错、到录入系统的全自动化操作。
弘玑尚书台(IDP)的优势?
弘玑尚书台可以识别“多”种文书单据,表格、无框列表、甚至手写图片
数据处理时间少于手动处理一半以上, 原先耗时5分钟的任务,只需几秒钟“快”速完成
手动处理易出错,弘玑尚书台基于AI帮助校验和审核,工作完成的又“好”又准
无需耗时且昂贵的标注和模型训练,还可按需付费,方便又“省”钱
弘玑尚书台(IDP)的应用场景
财务报销:识别全国绝大多数财务报销流程中的增值税发票、购物小票、火车票、出租车票、过路费、行程单等票据,支持票据拆分、混贴、公章识别、票据分类、核算稽核等财务需求。
物流场景:支持各类物流过程中的磅单、发货单、收货单、财务发票、海运托书、提单、海关报关单的自动识别、解析、录入、校对等全过程。
人事管理:自动化识别和验证公司入职、背调、信息录入等员工提交的身份证、户口本、学位证书、学位证明、银行卡等个人信息,并支持自动验证真伪。
政企场景:支持企事业单位的对公业务往来中的公司三证、组织机构代码证、法人证明,和各类行业经营许可证的识别和自动处理。
……