达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

三峡集团与达观数据携手建设智能化董事会系统,有效提升董事会治理效能

国有企业改革三年行动是过去三年落实国有企业改革“1+N”政策体系和顶层设计的具体施工图,是可衡量、可考核、可检验、要办事的。2022年是该项工作的收官之年,做好这项工作,对做强做优做大国有经济,增强国有企业活力、提高效率,加快构建新发展格局,都具有重要意义。国务院国资委将坚定不移狠抓国企改革的责任落实、重点举措、典型示范,切实提升改革综合成效,增强国有经济竞争力、创新力、控制力、影响力、抗风险能力。

为推进国企改革工作走深走实,引领企业高质量发展,三峡集团公司与达观数据携手研发建设智能化董事会运行管理与评价系统(简称该系统),为集团公司及各级子企业董事会相关业务提供信息化、智能化、人性化的智能管控平台,保障各级企业董事会成员和董事会工作机构可高效、便捷地开展董事会运行管理与评价,有效提升董事会治理效能,下面就通过几点介绍一下本系统的落地场景。

目前董事会业务面临的关键问题

图 1 业务困境

那么在明确了目前的业务痛点之后,解决这些难题的核心能力是什么?我们知道董事会的业务会涉及会议、调研、信息沟通、评价等,所以除了搭建一套完整的线上业务之外,这些业务会涉及大量的文本数据,比如议案材料、会议决议、会议记录、调研材料、调研方案、调研报告、专项报告、董事会授权行权执行报告等,因此要想该系统“好用”,非结构化的文本数据处理能力——NLP(自然语言理解)是系统建设的重中之重,下文就从几个场景举例介绍,智能手段为董事会业务系统带来的变革。

NLP在该系统中的应用

达观自研NLP基础平台融合多种机器学习算法,结合达观数据独特的语义理解、分析引擎,能够对文本数据进行词汇级、句法级、篇章级的理解,一站式满足用户文本语义分析、文本审核、文本实体抽取、关系抽取、情感分析等需求,用户无需拥有丰富的算法背景,仅需小样本的业务数据,即可通过平台快速创建算法模型并使用。图 2达观NLP语义分析

达观自研的智能化董事会管理与评价系统就是以NLP平台为基础,结合自研的OCR、知识图谱、智能搜索等技术,能够有效地把非结构化数据转结构化,从而实现从海量且纷繁复杂的业务文本数据中提取有价值的信息,帮助企业实现文本内容审核、文本形式校验、文本智能搜索、文本智能比对、企业制度知识图谱查看、董事系统评价自动稽查等功能,从而使企业的董事会业务提高效率、科学决策、智能化管理的目标。图 3 达观智能化董事会管理与评价系统架构图

智能化董事会系统功能介绍

01场景:制度、文档智能搜索

该应用场景基于ES智能搜索引擎结合NLP(自然语言处理)技术、OCR(光学字符识别)技术,能够实现智能化董事会系统日常的各种文档的全文搜索,文章类型包括word、PDF、扫描件等各种非结构化文档;自主研发的ES智能搜索引擎能够为董事会业务系统提供丰富的智能应用场景:包括董事业务筛选、拼音搜索、query纠错提示、下拉提示、热门搜索、推荐搜索、同义词搜索、query归一化(简体/繁体识别、全角转半角、阿拉伯数字与中文数字归一化检索)等多种业务场景的智能搜索。图 4 支持query拼音检索

图 5 搜索query下拉提示

图 6 搜索结果按照相关性/时间排序

图 7 高亮显示Query命中的标题/全文

02场景:OCR智能解析、识别图片内容

通过自研的光学字符识别技术,实现图片中的文字识别提取,能够支持识别会议扫描件、图片、证件照等多种格式,为智能搜索、董事会业务系统提供图片数据的智能加工,也能够作为日常办公小工具供业务人员进行图片的文字识别、提取。

图 8 OCR文字识别

03场景:智能化解析文档目录

通过文档审核系统能够对文档的目录进行识别与提取,支持的文档类型有word、PDF,主要是为智能化董事会系统的文档预览提供目录识别,协助业务人员进行更方便的查看、审核业务文档。

图 9 文档目录提取

04场景:文档内容及形式审核

通过文档智能审核系统能够对董事会管理系统的业务文档进行格式学习,能够实现文档的智能化形式审核,包括文档的序号、文档的字体、文档的行间隔,对于不符合三峡文档规范的形式问题能够进行错误识别以及批注,业务用户可以在线下载批注文档,以便线下进行文档格式调整,从而避免了业务人员在日常工作过程中较易出现的文档形式错误问题。

图 10 文档格式、内容错误审核

图 11 议案材料的完整性审核

05场景:智能化文本比对

通过文档智能审核系统能够实现文档一对一、一对多的文本比对,能够识别出不同文档内容的差异性并且能够高亮与定位,用户能够便捷地自动查看到对比文件与原文件的不同之处。图 12 文本比对

06场景:智能化文本内容抽取与审核

使用达观的智能文本处理系统,能够通过对制度规范性文件的大模型学习,并检测文件要素是否齐全,比如会议材料要素/附件有无缺失、会材料中的投资金额,会议材料的要素有无缺失,从而能够实现关键文件的智能审核。图 13 授权执行情况内容抽取

图 14 授权执行情况内容抽取后做统计分析

07场景:知识图谱

以相关业务系统文件及制度文件数据为基础,构建了制度关系图谱与董事人员画像图谱,从而实现了基于图谱引用关系的的智能搜索以及关联查询。

图 15 制度依据文件关系图谱模式设计

图 16 制度图谱搜索效果

08场景:热门推荐

能够提供基于用户行为数据的热门推荐,通过用户画像分析,能够知道用户喜欢搜索哪些热门query,为系统用户拓展更多的热搜query。图 17 热门搜索

09场景:相关推荐

能够使用文本相似算法,在用户搜索时提供类似的其他用户的query,引导当前用户了解更多相关数据,从而增加搜索的召回率。当用户浏览文档详情时,使用文本相关性算法,把当前文档的标题与其他文件标题进行比对,从而找出相关性较大的其他文件进行推荐查看,其目的也是为了扩展用户的“知识面”,引导用户了解更多相关数据。

图 18 业务文档的相关推荐

图 19 制度的相关推荐

10场景:文件自动打标签

通过对董事相关业务材料进行标注、机器学习能够对文件进行智能打标,能够让系统用户一目了然的看到核心内容;也能够根据材料标签做一些相关的推荐。

图 20 材料打标及推荐

图 21 标签推荐

图 22 自动生成业务文件

11场景:文件在线批注

通过达观自研的文本标注器功能,能够通过划选实现PDF、doc、dox格式文件的在线批注功能,系统应用页面有董事审核调研报告。

12场景:文件在线生成

能够根据董事会日常办公的文档格式、模板自动生成相关的文件,帮助董办人员自动生成日常办公文件的编写工作图 23 自动生成会议请示示意图

13场景:董事人才结构实时分析

通过对专职相关人才库数据的统计、分析,自动生成专职董事人才结构分析图表,包含性别构成分析、年龄及学历构成毕业院校分析、专业分析、专业技术职务分析、专业技能方向分析。图 24 董事数据实时分析

14场景:履职情况自动汇总,图表化展示

15场景:评价数据可考核、可衡量、自动计算

董事的系统评价支持纯系统取值判断,不仅能支持对接各个业务系统的日常工作留痕数据,也能够对多种等非结构化文档中做智能抽取、统计、分析,从而为董事相关的某些评价指标的完成提供数据支撑,真正做到董事会工作及董事评价工作的可衡量、可考核、可检验。图 25 系统评价指标评分自动核算图 26 系统评价自动稽查

16场景:自动生成董事会运作评价

能够通过图表量化展示下级的董事会运行评价,如企业排名、指标平均分;可以根据实际的评价数据自动生成分析报告,具体如下图所示。图 27 董事会运作评价自动分析

17场景:自动生成评价分析报告

可以根据实际的评价数据自动生成分析报告,从而减少业务人员的报告撰写时间,具体如下图所示。图 28 系统评价报告自动生成

达观数据始终秉持着“通达乐观 务实求真”的理念,致力于成为中国第一的智能文本处理企业。自2015年成立以来,达观一直专注于自主研发自然语言处理(NLP)、机器学习(ML)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)、知识图谱等技术产品与服务,现已广泛落地于金融、制造、地产、能源、通信、传媒、医药、政务等领域,累积上千家知名政企客户,未来也将持续稳步发展,引领行业风向,帮助更多的企业实现数字化和智能转型,提高企业实效。