在2020年世界人工智能大会云端峰会中,达观数据与浦东青联联合举办了“智能时代,‘语’你同行”行业论坛,围绕语言智能,与多位行业专家与学者展开了一场精彩线上交流盛宴。
达观数据陈运文博士在论坛上进行了《智能文本处理技术与未来办公机器人》的主题分享,在其分享中,和线上观众介绍了多款智能办公机器人的应用场景与未来展望。以下为演讲内容精华整理,观看大会回放可直接下拉最下方二维码进行精彩回顾。
大家好,我是达观数据创始人兼CEO陈运文,今天非常荣幸在世界人工智能大会的舞台,使用云端的方式和大家分享《智能文本处理技术与未来办公机器人》。
首先和大家科普一下文字语言处理的概念。在人工智能版图中,从技术站分为三方面:图像处理、语音识别和文本处理。文本语义理解是人工智能领域中技术难度最高,处理技术最复杂的领域,因为语言文字高度抽象概括,被微软创始人比尔盖茨称为“人工智能皇冠上的明珠”,它涉及人们日常工作范围最密集的领域,所以让计算机处理文字有巨大的实用价值。
我们今天对文字的应用,传承自5000年以来人类使用文字的经验。人类历史上最早的四种文字,从楔形文字到埃及圣书文、玛雅文到中国甲骨文已经有5000年时间。文字是人类文明诞生和发展的核心标志,我们今天所有日常工作和信息交流都离不开对文字使用。
在文字诞生之前,信息只能靠基因发展延续下去,文字发明后,理性和抽象思维能力得到传承,大幅度提升了人类文明的进化速度。在计算机科学发展之下,能否让计算机这项非常强大的工具帮助我们更好地进行文字阅读写作、审核、分析的工作,减少工作中对文字处理的繁重负担,我们认为是非常有意义的事。
达观数据的核心技术自然语言处理(Natural Language Processing,简称NLP)它分为:自动阅读和自动写作。计算机有阅读能力后可以帮助我们进行核对、审批、查验、分析、派发等日常工作;计算机具备写作能力后可以帮助我们起草日常报告、进行润色纠错、辅助填表、扩充内容等。
今天企业日常办公中需要大量的文档资料处理工作。从早期的算盘、帐本到现在的自动化处理技术,以及大量自动化处理的相关智能技术,这些技术逐步发展,对我们办公的自动化发挥了巨大价值。
我们认为RPA是我们今天办公机器人的非常关键的应用基础之一,RPA,Robotic Process Automation,英文翻译过来叫机器人流程自动化,它的特点是计算机软件可以模拟人进行键盘和鼠标的操作,从而把在电脑上进行的大量规则性、重复性、事务性的工作大幅进行自动化,流程性的重复性工作将提升几十倍效率。
我们认为利用好RPA,再结合语言文字认知的相关能力,就可以在办公场景中做很多工作。RPA可以登陆应用、移动文件、读写数据库、从文档和表单中提取信息、邮件处理等等。将这些工作能力进行合并,就是一款款智能办公机器人。我们来看一下几款办公机器人的例子。
- 智能报销机器人:财务部门需验证大量发票真伪,将报销费用、分摊费用、信息手动录入ERP财务系统,完成报销流程。通过达观智能办公机器人,将自动识别各类发票,包括增值税专用发票、增值税普通发票、机票行程单、火车票、餐饮票等,并将识别结果结构化,每笔报销缩短为5min。
- 邮件自动化处理机器人:会计部门业务人员每月需多次向相关单位发送账龄信息收集通知邮件,并在指定时间内收取单位回执邮件,对附件数据进行汇总。通过达观智能办公机器人,可根据邮件主题关键字收取指定邮件,统计已回复邮件单位及超时未回复单位,并根据业务需求汇总各单位回执EXCEL文件数据,每封邮件处理时间由3分钟缩短至0.5分钟。
- 财务报表机器人:银行客户经理需将大量财务报表上的数百项信息手动录入至银行系统,还需将财务信息填写至尽职调查报告,这些财务报表数量多、会计科目数值大、人工采集非常耗时、易出差错。智能办公机器人可自动识别企业财务报表并录入系统,自动生成信审报表,全流程从4小时降低至10分钟内,效率提高23倍。
同业对账机器人
贷款信息录入机器人
纳税审核机器人
披露报告撰写机器人
扫码下方二维码,观看大会精彩回放