达观数据OCR赋能银行会计核算数据集中系统降本增效丨达观动态-达观数据-企业大数据技术服务专家

达观数据OCR赋能银行会计核算数据集中系统降本增效

分类：产品介绍
发表：2021-07-08

在银行为代表的金融行业业务场景中，有大量影像文字信息录入需求，比如身份证识别、户口本识别、军官证识别、港澳通行证识别等各类证件识别都可通过标准OCR模型进行识别。但基于行内银行存单、支票、内外部凭证等影像信息人工分类与录入会消耗大量人力、物力和时间成本，严重影响业务流程的效率和用户体验。

达观数据基于深度学习渊识OCR平台通过简单易用的可视化配置，可快速实现对业务量繁多的银行存单、支票、内外部凭证等影像识别工作，从而实现这项业务的自动化处理，大大减少客户业务办理时间，同时也可以将柜员进一步解放出来，更多地从事服务与营销工作。

近年来，工商银行、建设银行、交通银行、华夏银行以及某些农村商业银行等均将OCR引入业务处理系统，并根据银行系统的业务处理特点进行流程改进，在提高自动化程度的同时，也扩展了业务范围，完善了管理机制。

根据目前银行会计核算数据集中系统人工录入模式，网点扫描上传的凭证影像经过切片拆分(部分影像无需拆分)后由专业录入人员录入，每一项要素至少经过两人录入，两人录入要素比对一致后方进入系统校验等自动环节，若两人录入要素不一致还需第三人进行补录再核对校验。这种人工录入模式因节点多、影像申领慢、易受人为延误影响而效率较低。OCR技术与银行会计核算数据集中系统业务的有机结合，将大幅提升业务的处理效率和精确度，增强系统的承载能力和自动化水平。

渊识OCR平台

模板标注平台

针对不同版式样本仅需1张训练图片，基于底层深度学习算法模型内嵌“预标注”和“预识别”功能，支持快速标注关键字段及全文本字段识别，显著提升标注效率，可应用于版式多样、识别特定字段、图像质量统一的场景，同时模型重训功能支持新增版式的快速扩充。

模型训练平台

基于端到端可训练的快速定向文本定位（FOTS）网络通过数据样本标注、模型训练、模型一键导出，一键部署功能，完成模型从0~1的发布。平台兼具有数据自动生成能力，可模拟各类真实场景中复杂数据状况，如模糊、变形、缺角等，少量标注数据即可获得更高的识别准确率。

银行2

数据校正平台

数据校验审核是弥补系统识别错误的有效环节，也是影像识别的最后关卡。一般来说，OCR识别无法达到100%准确率，对于不能完全确定或识别认为有误的字符，会对字符进行差异化显示。引入字符识别校正平台，可以通过OCR识别返回置信度、候选集等信息，设置阈值来自动推送至人工判断或补充识别结果。

银行3

达观OCR应用价值

大幅降低经济成本

以银行集中运营业务为例，假定一张凭证可拆分为10个切片，每个切片6个字，按照国际打字速度评级标准，专业人员每分钟仅能输入150-240个字，按照240个字／分钟，一个人录完一张凭证需要15秒；OCR每分钟识别6000个字，一张凭证转换不到1秒。效果非常可观，其所释放的机械劳动工时可用于更富有创造力、更复杂的工作。

减少人工差错率

OCR识别引擎长期稳定运行、不受人类情绪影响的特性可保证其在长期重复的工作过程中少犯错，有效减少各类可能的业务差错，提升工作质量。

优化业务流程，提高处理时效

目前，业务处理流程包括影像扫描上传、影像拆分、影像切片录入、业务撮合校验、账务处理等。通过引入OCR识别技术，将改进处理流程为影像扫描上传、OCR影像识别、要素信息输入、业务撮合校验以及账务处理等，不需“影像拆分”环节，业务处理环节减少，处理时效大为提高。尽管OCR识别需要“人工校正”辅助处理，但基本实现了柜台扫描发起后，系统的全自动化业务处理。