达观数据是国内RPA赛道入局较早的玩家之一。但在采访中,陈运文更乐意强调达观数据文本数据处理的AI能力,而非近两年风头更劲的RPA技术。“达观做的,是人工智能领域文本数据处理细分,再结合RPA技术,最后落地到企业服务的应用场景。”
文|敖瑾
编者按:他们创办的公司或已是独角兽,或刚启动种子轮,或已家喻户晓,或长期身居幕后,或正起于微末,但他们都是中国新经济的微观脉搏,是这轮产业和技术升级的微观主导者和实践者,不同行业成千成万的他们的身影汇聚,投射变革的洪流。
《科创板日报》 “连线创始人/CEO”栏目,主要关注创新创业型企业,以企业创始人/CEO的访谈为一手信源,让成长中的创业公司走入公众和市场视野,并发掘最新技术和产业趋势,每周五21时准时推送。
RPA无疑是近两年全球企业服务领域一条极热门的细分赛道。创投日报记者不完全统计,2021年至今,国内已有17家RPA公司完成融资,总金额超过36亿元。其间,多家公司还获得了投资机构两轮以上的大额出资。
RPA,全称机器人流程自动化,这是一种软件技术,本质上是让计算机通过学习和记录人在电脑上的操作轨迹,再进行重复和模仿,最终实现计算机流程操作的自动化,达到利用技术手段降低企业人力成本、提高工作效率的效果。
而AI的加入,则让这个本就火热的赛道更加充满想象空间。通过文本资料处理、图像识别等AI能力的加持,RPA开始从机械化的任务执行,逐步演进到到拥有认知和决策的能力,成为公司里的“机器人白领”。
“机器人白领在规则明确的岗位可以显著提高效率。目前,计算机处理文字资料的速度比人要快200-300倍,而且准确性要高很多。”达观数据CEO陈运文在接受创投日报记者专访时表示。
让软件成为“数字白领”
达观数据是国内RPA赛道入局较早的玩家之一。但在采访中,陈运文更乐意强调达观数据文本数据处理的AI能力,而非近两年风头更劲的RPA技术。“达观做的,是人工智能领域的文本数据处理细分,再结合RPA技术,最后落地到企业服务的应用场景。”
今年3月,达观数据完成最新一轮融资,总金额5.8亿元。除深创投、襄禾资本、弘卓资本、联想之星等投资机构外,达观还吸引了中信证券、招商证券、广发证券、中信建投四家券商的出资。据陈运文介绍,四家券商均为达观数据的客户。
RPA技术的应用,最早可以追溯到1994年微软发布的Excel5.0中的Macroinstruction(宏指令)功能,随着数据库和编程技术的成熟,逐渐形成了现代RPA三件套的低代码软件开发工具包,即流程设计器、控制中心、机器人。由于可以模拟人类在计算机等数字化设备中的操作,因而在应对大量、简单、重复的工作场景方面,RPA展现出强大的应用优势。
“白领在日常工作当中,一些动作是有规律可循的。比如说政府部门的审批工作,它是有一套固定的流程的,包括收取资料、录入信息以及对照审核,最后是根据规章制度批复。计算机可以学习模仿这一套行政审批的流程,然后自动完成这套审批工作,解放人力。”陈运文以此介绍RPA在实际工作中的应用场景。
陈运文于2015年创办达观数据,此前他曾担任盛大文学的首席数据官、腾讯文学的高级总监以及百度的研发工程师。文本智能处理,是陈运文和团队一直主攻的方向,而当文本智能处理叠加RPA技术,则让达观数据成为了一家AI+RPA的企业数字化服务公司。
传统的RPA只能覆盖数据录入与统计,而加入文本智能处理能力后,这套软件系统就可以完成审核、分析评判甚至撰写、决策的工作,成为真正意义上的“数字白领”。
陈运文介绍,成功打造一个“数字白领”,设计到三大关键技术:构建语言模型、搭建专业领域的知识图谱以及RPA技术,而难点集中在前两点。
“虽然常用汉字只有4000-5000个,但汉字的排列组合生成的语义却是庞大的,人类通过大量的学习和训练形成了快速辨别语义的能力,而让计算机系统具备这样的能力就要通过大量的数据搜集以及大量的算法构建来完成。最终达到的效果是,计算机能做好阅读理解。”
除了理解文字意思,“数字白领”还需要有行业知识,才能适应不同的行业应用场景。“比如要让计算机去做财务的工作,那它就需要具备非常强的财务会计知识,包括理解专业术语、清楚财务数据之间的勾稽关系。”
陈运文进一步介绍,达观数据目前的语言模型日常文本处理的能力,已经达到了和办公室白领持平的状态,“目前计算机助手对字词句和篇章的阅读能力还是很强的,甚至计算助手在纠错等具体工作上,做得比人还更强,因为计算机的精度比人类要高。”
而更难的,是搭建知识图谱的部分,“越是垂直领域的专家经验,就越是高度抽象和凝练,因此计算机掌握起来其实非常难,并且行业众多,每个垂直领域都有自己的专业知识,很难做到穷尽,目前我们只能每个垂直行业逐步进行突破。”
陈运文表示,达观目前设置了专家团队,构成人员均为各行各业的自身从业者,让他们与工程师团队配合,“让工程师听懂业务专家描述的技术概念,再把这些概念变成计算机的程序代码,让机器人学习。现在我们做的是先将基础知识以及相对简单的专家经验沉淀到图谱中,再由浅入深。这是一个非常漫长且困难的过程。”
据介绍,当前,达观数据在制造业、能源、金融、政府等领域已经构建了初步的专业知识图谱,搭建了相应的“数字白领”,完成初级到中等复杂的工作。
四家券商客户成为股东
在达观数据的最新一轮融资中,出现了四家券商投资方,而这四家券商均为达观数据的客户。
统计数据显示,在RPA服务的各个行业中,金融领域的RPA渗透率最高,约为5%~10%。与其他行业相比,金融行业具有高度数据化以及面临强监管的特征。这意味着,金融行业需要大量人力去保证数据的精确性。“数字白领”正好可以实现降低人力成本同时确保信息准确的需求。
陈运文向创投日报记者介绍了“数字白领”在券商中的工作场景。“你可以理解为这是一个数字员工的软件平台,平台汇集了大量的券商知识图谱、语言模型和文字资料,生成了训练好的可以随时上岗的机器人,它们以软件的形式存在,具备不同的技能点,比如有的擅长托管合同的审查、有的擅长做银行流水单据的核对、有的擅长写年报季报等报表。当券商相应的工作岗位缺人了,或者需要人手做复合,就可以在这个数字员工平台招相应的机器人,完成对应的工作。”
陈运文表示,有合作过的券商客户反馈,“数字白领”发挥的作用非常明显。“原来这家券商的托管部门大概有40多个全职员工,专门完成托管合同的处理工作。数字白领的加入,把员工数量降到了个位数。此外错漏风险也控制到了5%以内,过去通过人工来处理,有券商还曾因为人为的错漏面临处罚。”
这种对效率直观的提升,是RPA成为企业服务领域最热门的细分之一的重要原因。德勤RPA研究报告显示,如果计算一家收入在200亿美元且拥有5万名员工的财富1000强公司,其中20%的工作流可以用RPA自动化操作完成,那么每年就可带来超过3000万美元的利润。
另有统计数据显示,在中石化和浦发银行部署RPA项目的实践情况中,以流程、人员和机器人对比的效率优势为核心估算,省略其他资本运营费用,RPA项目的ROI值分别约达1158%和1027% 。
除了速度和精度,“数字白领”还具有不受情感因素影响的特点。“审批流程中,机器人可以做到更加客观公正,不受情感等因素影响,保证审批结果的公正性。因此我们认为,计算机在规则特别明确的工作岗位上,可以大幅度提高社会运转效率。”陈运文表示。“目前,国内的白领和公务员数量加起来有大概5000万人,他们坐在办公室的格子间,靠一台电脑去完成所有日常工作,数字员工的加入,可以大幅减轻这些工作岗位的工作负担、提高效率。”
统计预测到2025年,全球RPA市场规模将达到225亿美元。随着RPA需求的飞升,入局的玩家也越来越多。不仅有达观数据这样的初创公司,互联网大厂也纷纷下场,竞逐这个在国内兴起还不足五年的市场。比如,阿里很早就有自己的RPA产品,即客服常用的自动化消息群发工具。此外,华为云、苏宁云、平安云等云平台,以及用友、金蝶等传统IT厂商也都纷纷在RPA市场布局,专注财务、人力资源行政等多个办公场景。
陈运文表示,大公司有软件技术经验和B端服务的丰富积累,但创业企业相比较而言更加灵活,更能贴近客户的需求。“大型公司的商业逻辑,决定了他们更多的是做一个平台型的产品,搭建一个大而全的系统,因此比较难真正深入到各个垂直领域去,而初创企业一方面重视技术基础,另一方面更能去适配客户的需求,提供更符合客户业务特点以及场景需求的产品。”
不同的服务模式决定了RPA厂商的不同市场定位,以国际上头部的厂商来看,目前RPA厂商主要可以分为两大类,一类是做工具,以去年在纽交所上市的UiPath为代表,这类厂商给用户提供产品学习资料,并亲自帮助用户来打造流程和部署实施;一类则是做平台,以Blueprism为代表,倾向于为大型客户提供统一的机器人操作平台,帮助团队实施,形成行业级应用平台。
陈运文称,达观数据目前两种服务都兼而有之,“两种模式其实依赖于不同的客户的员工的能力和素质。在和客户打交道的过程中,我们会发现更多国内客户倾向于选择‘交钥匙工程’,也就是最好客户不用去费心去学系统的运转,理解就内部原理,也不想花太多精力在这上面,最好是供应商派工程师把所有东西全搞定。”
国内的企业数字化转型推动了这一轮企业服务赛道的极速发展,但陈运文认为,国内的企业的信息化数字化水平仍然还有很大的提升空间。
“很多企业其实还是用纸质文件进行签字盖章审批等等,国内企业的数字化信息化进程对比国外来说可能还要落后个10年左右的时间,中小企业落后的时间可能更久。”陈运文表示,在这样的背景下,国内企业服务厂商交付软件的方式也需要贴近实际情况。“一方面要借鉴欧美成熟的数字化社会,但同时也要实事求是,很多企业可能内部就是还没有搭建起来数字化系统。”
因此,他认为,当前企业服务供应商要取得成功的关键,还是得贴近用户和市场。
“不管你是属于公有云还是私有云或是混合云,订阅制收费或是一次性收费,这些部署方式对客户来说都不是最重要的,客户只关心系统能解决他们什么样的痛点,效果有多好,帮客户降本增效能达到什么样的程度,这个才是关键。当前国内企业信息化标准程度不够,每个企业的系统也不一样,一味追求标准化产品,现阶段来看太理想化,也很难做到。因此,当前企业服务供应商在提供系统时,要因地制宜地根据不同客户的信息化状态,定制化地提供相应服务。”