香港人工智能及机器人学会副理长车品觉谈数据的本质|达观WAIC回顾
在2021年世界世界人工智能大会云端峰会中,达观数据与浦东青联联合举办了“智能办公 文本赋能”智能语义分析论坛,围绕自然语言处理,多位行业专家与学者展开了一场精彩的交流盛宴。论坛上,香港人工智能及机器人学会副理长、前阿里巴巴集团副总裁车品觉先生围绕对大数据未来趋势的独到见解,分享了《数据的本质》的主题演讲。以下为演讲内容精华整理。
国务院早前发布《关于构建更加完善的要素市场化配置体制机制的意见》(下简称《意见》),其中涉及了土地、资本、技术、数据要素市场等内容。为了未来发展及疫情后的经济驱动,需特别关注《意见》中关于数据要素市场的三点内容:1.推进政府数据开放共享。优化经济治理基础数据库,加快推动各地区各部门间数据共享交换,制定出台新一批数据共享责任清单。研究建立促进企业登记、交通运输、气象等公共数据开放和数据资源有效流动的制度规范。2.提升社会数据资源价值。培育数字经济新产业、新业态和新模式,支持构建农业、工业、交通、教育、安全防范、城市管理、公共资源交易等领域规范化数据开发利用的场景。发挥行业协会商会作用,推动人工智能、可穿戴设备、车联网、物联网等领域数据采集标准化。
3.加强数据资源整合和安全保护。探索建立统一规范的数据管理制度,提高数据质量和规范性,丰富数据产品。研究根据数据性质完善产权性质。制定数据隐私保护制度和安全审查制度。推动完善适用于大数据环境下的数据分类分级安全保护制度,加强对政务数据、企业商业秘密和个人数据保护。
上面三点内容总结了大数据十几年发展的经验,为机构与企业数字化转型提供了思考框架。首先,推进政府的数据开放,使数据能够共享到不同的群体当中。政府拥有企业登记的有关资料数据、交通数据、气象数据等大量数据,如果开放这些资源,就可以将数据有效地在社会中流通,从而让社会发掘产业数字化的资源价值。其次,在新的经济产业当中,数据如何发挥驱动作用推进产业数字化,各行业正进行多种探索。第三点,加强数据资源保护,只有资源得到适当的安全保护,才能被更好的使用。要实现上面的过程,往往需要倒过来看,因为数据安全是其他的前提,但现实生活中无法形成良好的数据安全环境。所以从实践角度要倒着看这三点:1.保障数据安全(包括个人隐私保密、企业机密)是最基本的。否则数据会变成一堆有害无益的垃圾。
2.是否有一个良好的生态环境推进行业数字化,包括数据资源、技术、人才等。政府除了拥有数字管治权以外,还拥有促进新经济的责任。所以相关行业协会要更主动地担当公共数据汇聚及开发的桥梁。
3.在数据安全管控、应用市场足够蓬勃的基础上,开放共享数据是数字经济高增长的核心价值。最关键的是:协调、规范公有及私有数据的流通机制及伦理规范。
通常来说,数据战略有四个抓手。1. 数据资源的积累2.数据技术的积累
3.组织适配
4.机制建设
四个抓手互相配合,才能够在政府和企业中发挥数据作用。
获得数据之后,有两种使用数据的方法:1.“用问题找数据”。从实际应用出发,需要打通数据,进而汇通大量数据。简称“用、通、汇”2.“用数据找问题“。先打通数据,再对数据使用并管理。简称“通、用、管”
在平台运营中,有时需要先用大量应用打通数据,数据资源累积到一定程度后,反过来开发更多的应用。上述两种方法描述了城市当中数据应用的不同阶段,分别对应十四五规划中的“产业的数字化”与“数字的产业化”两种说法。
同时,数据具有内外视角,“用问题找数据”使用的是数据的内视角,可以通过足够的数据解决问题。但从数据过渡到大数据,很多时候都运用数据的外视角。透过大量数据,来看它们能够解决什么新的问题。拥有大量数据之后,需要一种标准,判断何时打通数据。在制定标准之前,要明白三点:第一,数据资源以及应用呈现“强者越强”的趋势;
第二,数据存储成本越来越低,但提炼、治理成本不菲;
第三,数据只有在多场景里重复使用时,才能呈现出效益。所以在一个城市里,必须找到数据重复使用的场景在哪里,减少治理成本,以及找出“强者越强”的应用点。
数据的价值主要取决于其使用后的效果。如果没有把服务数据汇聚起来,很难证明数据本身的价值,所以人们往往容易低估数据的价值。数据的成本包括收集成本和治理成本,甚至包括维护成本,成本高导致数据难以维持新鲜度和整体性。在这个问题上,无法运用上面所讲的“用问题找数据”和“用数据找问题“两种方法解决。想要解决实际问题,必须要找到切入点。
在城市与企业当中,存在几种偏差:1.什么时期用哪种方案,怎样平衡短期效益与长期成果?2.做技术变革时,如何平衡管理变革?
3.互联网习惯快速试错,但很少注意系统的稳定架构。
认知方面与实际管理之间,如果没有达成共识,就会存在以上三种偏差。
数据是生产要素,这是数字经济的重要特征,且数字经济的实质是以计算机及互联网为中心的变革。数字经济的概念同时涵盖网络经济、数据经济和信息经济三种信息,要充分利用网络经济的优点、信息经济的优点,将数字经济放在智慧城市或企业的长远战略中。
数字化转型的战略框架依次为:数据战略-数据治理-数据中台。很多企业在实际解决方案中将其本末倒置。先思考要不要将重点放在数据中台、让多名技术人员参与到方案当中。这样就会忽略,良好的网络效应、信息效应才能与数据驱动所需要的资源和人才达成共识,这就是数据战略的重要性。数据战略的方向决定怎样进行数据治理以及数据要素的范围,之后才能够决定使用何种技术处理或辅助数据战略达到成功。