近期,达观数据通过自研的达观智能文档审阅系统,帮助证券行业实现了文档审核审批业务的智能化及自动化,极大程度地提高了工作效率和数据抽取的准确性。
达观智能文档审阅系统通过引入比对文档关键信息自动化提取、通过对标准版本识别、不同版本差异比对、审批风险项预警等,实现以“秒级”的时间展示结果,并对比对结果进行深度分析以及图标可视化。操作过程极其便利,只需一键导入合同文本,即可快速检测合同版本之间的差异,数分钟内实现上百页合同的自动比对,完美覆盖表格、签字、水印、盖章等复杂场景。支持段落颠倒,同级比对等多种策略信息自动提取与录入,数百个风险点自动审查,有效减少证券业务人员的重复性工作,大幅提升合同审批效率和质量,平均一份合同比对的处理从半天时间缩短至1小时以内。
证券行业的托管部门每天需处理大量文本合同,格式包括word、PDF、图片等,日常痛点如下:
- 文档比对过于耗时,人力耗费较大:
进行不同合同版本的比对,例如客户修改版本与原始版本,最终审核版本与双签版本,一份一百页的合同比对通常需要半小时左右,如果是数十份合同,则需要消耗若干人的几天的工作量; - 人为过失难以避免,信息录入效率低下:
合同关键信息人工录入、复核、审批,一份合同的信息录入需要1-2小时时间,且无法保证信息录入过程中的人为出错; - 审核步骤过于繁琐,流程无法从简:
合同风险审查,例如分比例金额准确性审查,组织机构存续状态审查等合同规范性、合规性、一致性审查,审查不仅需要逐条审核,还需要其他文件例如身份证、营业执照、财务票据,外部数据库信息进行比对审核。
达观智能文档审核系统,基于深度学习、NLP(自然语言处理)算法通过对合同文本内容、合同管理制度要求的学习,不仅能从几百页的长文档中智能提取实体、关系级别信息,也能提取关键图表、段落、章节等文档要素级别信息,可百倍提升阅读效率。凭借稳定可靠的产品能力、优质的长期服务以及强大的产品交付能力得到众多金融领域客户的认可。
通过对某证券机构现有业务痛点的深入分析,达观基于领先金融科技能力为其构建非结构化文档智能审核平台,将非结构化文档数字化、结构化,实现内容的自动识别、智能提取、智能审核,在节省人工的基础上达到提质增效的目的。
以下场景使用情况为例:
01合同/文档内容的智能抽取
1.强大的自研标注功能:
(1)支持文字划选、框选、表格内容一键标注
通过标注好的训练数据,可以教会模型如何来识别文本中的内容及隐含的意图,使模型能够更加精准地抽取正确的内容。
图1 字段的划选标注
(2) 支持图片、表格框选
对于包含有图片,表格的文档,达观智能文档审阅系统可以通过框选的方式实现标注
图2 表格类的框选标注
2.简单个性化的抽取字段配置:
(1)支持指定抽取字段的新建,修改,删除,颜色配置,条款类型设置以及一键导入功能。用户可以根据字段类型需求选择不同的字段标注方案,实现不同形式的字段展示。
图3 基金合同抽取字段配置
3.文档内容智能提取,一键原文定位:
合同抽取结果支持显示后处理内容,智能高亮联动合同内容章节,方便业务人员定位到关键章节与内容。
图4基金合同的智能内容提取
某证券机构引入达观智能文档审阅系统从而实现对基金合同的智能解读,完成非结构化的关键信息提取,可结合不同合同类别特点定制算法,完美贴合业务需求,同时支持自定义合同类型,通过可视化界面自行训练模型,灵活扩展场景。大量的用户实际案例证明,使用达观智能文档审阅系统能够有效避免人工操作失误。
02合同/文档内容的多版本内容比对
1.个性化的比对规则配置:
支持文件类型,排版样式,文件内容,指定页码设置,透视矫正,边缘过滤等个性化配置功能。在默认比对规则不能满足特定需求的情况下,用户可根据实际情况修改比对规则,如:需要查出标点差异、需要查出段落顺序、忽略手写体差异等。
图5 比对规则配置选项
2.合同内容比对:
支持合同文档多版本的内容比对,能够有效帮忙业务人员快速识别、定位到不同合同版本的内容变更项。
图6 智能比对
3.比对图表统计:
精准统计出合同之间的差异个数及类型占比,免去审核人员再次进行统计工作的必要,减少人工作业。
图7 文档比对差异点统计
让机器“读懂”文档,让机器成为“伙伴”。在达观智能文档审阅系统(IDPS)投入到证券行业的建设项目以来,达观数据依托在金融领域AI技术沉淀经验,利用自主研发OCR、NLP等先进技术解决基金确认单、私募基金合同、文档比对、通用表格解析多类场景的非结构化文档的数据识别与处理,实现相关场景非结构化文档的识别解析、智能审核及与业务对接等,并通过平台化建设提供一定的可拓展性和泛化能力,助力证券行业的业务部门拓展更多AI应用场景,有效地应对大批量的合同审核事务性工作,减少重复作业,也能够释放员工精力,让业务专家们聚焦核心业务,证券机构中也实现了业务部门运转流程效率的提升。