疫情后,传统企业的数字化转型发展带来了新机遇,利用数字化进一步让企业提升市场竞争力已经成为行业共识,一场数字革命正在企业级市场全面推开。10月16日,人工智能领军企业达观数据和深创投在深圳联合主办未来企业数字化发展论坛。广东赛迪研究、 深圳市人工智能行业协会、招商证券、万科、时代中国等企业高层出席大会并分享精彩内容。
大会上,达观数据创始人兼CEO陈运文进行了《 智能文本处理技术与未来办公机器人》的主题分享,在谈及企业未来数字化发展时,陈运文表示“企业的数字化发展,关键要激发人、业务、数据三者的潜力。”——以下为演讲内容精华回顾。
大数据,小智能
随着企业的发展,有很多流程,但流程数量多了后会影响企业的活力。智能化技术则可以很好解决过渡管理和公司的矛盾。通过数据将人与业务结合企业,成为企业的驱动力。当下数据智能处理的大量内容来源于工作文档,通过智能化技术对文档内容进行挖掘与提炼,目前达观数据开发了针对不同场景的智能化系统,我们将其定义为“数字化白领”,希望这些系统通过理解文字、处理文字成为我们的助手完成相关工作。
文档自动化处理的难点
很多常识对计算机系统来说则是需要技术攻克的难点问题。例如“三个金融学院的学生,既可以是三个学院,也可以是三个学生。“他刚做完一场手术”,他,可以是病人,也可以是医生。”让计算机真正理解文字,需要攻克中文语义处理的难题,在这个方面达观数据投入了大量的研发精力,目前已经申请了100余项的专利和著作权,出版发表两本人工智能领域著作和数百篇技术论文。
金融行业因为与数据的高度相关性,成为率先应用人工智能的行业之一。分享中陈运文演示了达观数据智能化系统如何自动处理无框表格内容以及填写工作。计算机在识别处理实际情况时,需要应对污损、变形、揉搓、印章的遮盖等各类复杂问题。达观数据的文档智能化处理系统通过视觉检测技术可以精准识别文件中的各种样式表格内容,结合语言模型和关键信息抽取,可以快速定位表格单位缺失、标题不一致、语法错误等各类表格内容错误。
我们认为未来企业的智能化的办公形态,主要由三部分构成:
- 智能语义理解能力:即计算机可以对文档内容进行智能化的阅读理解;
- 行业知识图谱应用:不同行业规则与业务逻辑千差万别,做好智能化系统沉淀各个行业的知识图谱必不可少;
- RPA产品技术:RPA本质上让计算机模仿人的操作,从而将重复性流程自动化,但仅有RPA并不够,将AI的语义分析能力、行业的知识图谱结合起来才能打造出高水平的智能化系统。