人工智能(Artificial Intelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。既然是期望让计算机智能系统来代替人的脑力劳动,自动化的从事的各项工作,那么如何来衡量人工智能的实际水平呢?
无论是人工智能还是人类的脑力活动,所要面对的问题的难易程度各不相同;针对不同的应用场景,现在业界所掌握的人工智能技术的实际应用水平高低也各不相同。在选择划分人工智能水平的标准上,国际著名的人工智能专家Sandeep Rajani教授,在《人工智能:人或机器》(Artificial Intelligence-Man or Machine)一文中,将人工智能的水平和人类能力进行横向对比,划分成四个不同的等级:
- 巅峰级——已经实现了无法超越的最优能力
- 超越人类级——比所有人类的能力都要强
- 强人类级——比大多数人类的能力要强
- 弱人类级——比大多数人类的能力要弱
在介绍计算机算法和数据挖掘技术的教科书《智能Web算法》(第二版)中,达观数据CEO陈运文将Rajani教授的上述划分方法作了翻译和介绍,这里再做一些展开阐述。在当今时代背景下,现有各个不同应用领域里人工智能技术的水平高低情况和已经达成的水平如下:
巅峰级水平:
在一些规则完备、策略空间较小的应用场景下,例如在19*19的棋盘里下五子棋,如今的计算机技术已经可以穷举所有可能的对弈情况,确保与人类在任意对弈的情况下都可以实现最优的方案。同样在Tic-Tac-Toe(一种简单的井字棋游戏)、跳棋等领域,以及数据统计等工程应用方面计算机已经是巅峰级水平了。
超越人类级:
AlphaGo和柯洁的围棋对战,以及IBM深蓝(DeepBlue)战胜国际象棋冠军卡斯帕罗夫,都展示了在这些复杂的棋类游戏上人工智能已经达到了超越人类级。在一些具体的应用领域,如指纹识别、虹膜识别等领域,技术也已经非常成熟,同样实现了超越人类的能力。
强人类级:
有些智力活动需要深入的领域经验,计算机相比少量的专业人士能力还有差距,但是比一般大众的能力要强。例如在德州扑克、桥牌等领域,计算机已经强过大部分普通人类了,在一些专用领域,例如在良好条件的人脸识别(没有不良的遮挡、光照、角度问题)、良好条件的语音识别(没有特殊地域口音、复杂环境噪声)等领域里,花卉植物种类的识别等领域,计算机的能力也已经达到了强人类级。
弱人类级:
有很多技能大多数普通人类掌握起来并不难,例如驾驶汽车,但是对计算机系统来说,因为要采集的信号以及分析的数据情况非常复杂,目前还难以达到普通人类的水平,处于弱人类级。常见的还包括写作文章、阅读理解、人类语言翻译等领域。
上述介绍里,人工智能的水平从弱人类级到巅峰级水平高低各不相同。之所以人工智能在不同领域的发展水平不一致,主要是受三个因素影响,具体包括:
因素1 规则和评价方法的明确程度
越是简单明确、并且计算机可以量化评估的问题,通过人工智能来实现的代价越小,例如棋牌类游戏,计算机可以发挥的作用很大。
但是不确定因素越多的问题,计算机来学习时就会碰到很多麻烦。例如驾驶车辆,驾驶方法和路况变化很多,并没有非常严格而明确的“胜/负”、“好/坏”的驾驶方式;又例如麻将或扑克,有很多随机性因素,甚至有运气成分,处理条件并不严格一致,此时也会给人工智能更好的处理带来挑战(陈运文达观数据)。
因此,规则越明确、评判好坏的标准越客观的应用场景,目前人工智能技术的实践效果越好。
因素2 特殊情况出现频率的高低
很多应用问题,在典型场景下的处理和在包含各种特殊异常情况下处理,其难度差异非常大。
以人脸识别问题为例,在人脸拍摄条件良好、角度对正且无遮挡的情况下,现有机器学习技术完成人脸检测、识别的精度已经非常高。但是在实际应用时,会遇到相当多特殊情况,例如由于受到光照、角度等客观因素的影响,加上被拍摄者存在化妆、佩戴饰品、局部遮挡、年龄变化等各种情况,甚至少量情况下还存在被拍摄者试图通过整容或伪装方式,故意干扰计算机的识别过程,这些因素都会非常严重的影响实际使用的效果。
自动驾驶技术也同样存在大量的问题,例如正常晴好天气,和雨雪等恶劣天气,对解决问题来说难度的差别非常大。各种各样的路况情况,也对自动驾驶的实用化带来很大的挑战。
现有的大量人工智能应用,在实验室条件下很多已经达到了非常好的成绩,但是在工业化应用中,由于使用条件比实验室环境要复杂和恶劣的多,需要处理各种异常和干扰因素,因此很多应用的实际水平,还徘徊在强人类级和弱人类级之间。(陈运文达观数据)
目前人工智能的技术,从实验室走向实际应用,需要克服的问题很多,还有很长的路要走。在实际落地的时候,务实的做法是先限制具体的场景,尽量排除掉不确定性因素,简化问题。例如在自动驾驶技术的研发中,如果限制为固定线路之间、或者封闭道路内的应用,技术难度就会大大简化,此时往往就能从弱人类级往上提升1-2个级别,达到实际可用的程度。在文字阅读理解时,如果限制文本的行业、类型和理解内容时,也能大大的提升系统的准确率,达到可以实用化的地步。
因素3 积累的训练数据的规模
我们都知道,“大数据+算法模型=人工智能”,由此不难看出,人工智能的关键性的基础是大数据。俗话说,巧妇难为无米之炊,只有积累了海量的训练数据,才能将人工智能的水平向上提升。AlphaGo也是通过积累了数千万盘围棋对战棋谱数据,并进行充分的模型训练后,才打败了人类顶尖棋手的。
在每一个人工智能的应用场景里,数据积累程度的高低,直接影响该领域里人工智能的应用水平。然而现实领域里,很多训练数据的积累工作才刚刚开始。尤其是监督式学习所需要的“标注数据(Labeled Data)”的积累,往往需要大量的人工参与,成本很高,大大制约了人工智能在相关领域里水平的提升。另外有一些领域的数据因为受到一些政策因素的限制,例如医疗数据,或者有些数据被部分行业企业垄断,这些都导致数据难以流通,人工智能的水平提升也就比较缓慢。
随着近年来计算机硬件存储成本的迅速降低,云计算的逐步普及,数据积累工作的硬件环境迅速改善。数据采集的意识也逐步觉醒,希望在应用需求的推动下,有越来越多的数据被数字化,并记录下来,训练出优秀的算法模型来提升效果。
从弱人类级起步,到强人类级、超越人类级、巅峰级,任重道远。科学发展的脚步通常都是先易后难、化繁为简。随着技术不断的积累与进步,相信未来在越来越多的应用领域里,人工智能技术都能代替人类,来完成越来越多有价值的工作。