零售业如何结合人工智能提升行业收益?“猜你喜欢”之外人工智能技术还有哪些无限潜能?
1月23日,达观数据创始人陈运文博士受邀出席中国电商委举办的第六届中国电商年会,现场和电商行业领军者们分享了智能文本处理技术在电商行业的应用及未来。以下为演讲内容精华。
零售业销量提升
电商行业做数据应用时,常见的难点有哪些?
电商行业很多时候数据不够,有时能拿到的数据只是少量的交易数据,这个数据在整个数据中只占1%,也就是99%的数据没有采集到,如何把缺失99%的数据都采集到是一个难点。
第二,数据采集后,如何从海量数据中筛选出有价值的信息?很多企业拿到数据后常用的是分析销量等指标,但其实数据能做的远远超过这些。
第三,如何通过自动化的手段代替人工?在零售行业中,很多自动化还没有开始。电商行业因为天然具有互联网大数据的基因,很容易把人工智能技术应用在行业里,让自动化的方式来代替人工要做的工作。
第四,如何通过技术驱动进行精细化的运营和营销?很多零售行业中,依赖人工经验进行运转,例如如何选品,如何陈列,如何管理这些商品,但人工经验有时未必可靠,如何通过人工智能的方法,让整个的过程不再依赖一两人的经验,而是依赖科学的精细化方法,是电商行业的应用难点。
零售业销量提升
数据采集有很多方法,传统的数据都是数字型的数据,比如销量、价格,商品数量等信息,但现在采集的数据方式比以前多很多,最常用的一是电子标签,在商品当中使用可感应的技术,进出仓库可以感受到,在无人便利店应用较多。
二是图象技术,装配摄像头更加丰富地采集店铺、仓库很多的图象的信息。
三是企业中大量存在的文字信息,这三类数据以前没有采集的,现在有新的技术可以把这三类数据采集上来为我所用。
零售业销量提升
从文字挖掘的角度来看,商品描述是文字,商品的标题是文字,商品的介绍如何吸引消费者是文字,商品的类目、标签、价格都是文字。这些文字如何组织才能建立商品的内部体系?
以及用户的搜索词,像淘宝、天猫等电商平台主要收入来源来自于搜索词,搜索词是电商中重要的数据。达观数据服务的丰趣海淘,通过挖掘每个用户在电商平台搜什么找什么,更好实现文字数据的挖掘效果。
用户和浏览和购买行为非常重要。通常一个用户下单前,浏览行为是购买行为的100倍,如果只记录用户下单的,不把用户浏览的记录下来,也是缺失了99%的信息。用户采购完商品后对商品物流服务的各种评价也非常重要,只有通过对用户评论数据的深入挖掘,才可以不断改进我们的产品和服务。
文本智能处理技术在电商平台的应用主要有如下几个:
个性化推荐系统
在没有应用个性化推荐之前,推荐都是基于热门进行推荐。线上依靠电商编辑将每天热门的商品放在头版头条,线下有店员根据经验,把好商品放在进店的地方。当我们开始期待给每个用户提供个性化的需求服务时,个性化推荐便变得非常重要。
现在线上零售70%的销量来自于推荐引擎,个性化推荐非常有效提升传统人工推荐的效果。在个性化推荐背后是用户画像积累和分析的体系,线下门店中的推荐,我们知道他喜欢什么讨厌什么,他最需要什么,对这些用户的兴趣把握来自于兴趣本身。
当把这个过程交给推荐系统后,除了精准的推荐效果,反过来可以帮助我们更好的进行商品选品和质量提升,这一点非常重要。很多电商平台不知道消费者现在喜欢什么,进什么货,进多少货,对消费者画像的构建和行为追踪,能更好地指导零售运营。
客户意见分析
VOC也称为客户意见分析。达观数据为华为开发的VOC系统,帮助他们更好的深入挖掘每个消费者对商品的评论和服务意见。来自用户的评论,通常需要结合商品和服务的属性进行深入的挖掘,才可以更好的帮助商家了解消费者对每个消费品的细节意见。这其中需要用到很复杂的对文本语言理解技术,也就是让计算机像人一样理解文字的含义。
我们从互联网上采集的个人评论信息量非常大,可能每天过10万级,一些大企业平台会有百万、千万级,依靠人来处理几乎不可能,让计算机处理大量文本成为了企业的刚需。
合同智能审阅
今天的人工智能技术可以帮助我们完成很多文本的自动化处理,例如电商企业中有很多行业文书和财务条线。之前依靠人审合同、人签订合同、人来做文字管理,如果将这部分事情让计算机帮人实现,并且比人做的更好更快更靠谱,这个就是计算机做文字阅读的带来的价值。
合同解析也是企业常用的功能。企业有大量的合同,以往需要人来处理合同的撰写、修改、提取、阅读、审核等工作,但如今计算机可实现自动化进行合同文本的提取分析和挖掘,发现合同里面有哪些问题,哪些漏洞,这个合同和以前版本合同的对比有哪些不同?这可以极大提升企业的运营效率。
商业合同、票据的自动化解析、信息的自动录入等,计算机可把这件事情做的非常自动化,这也是人工智能技术为电商零售企业带来的真正效率提升。
知识图谱
知识图谱是最近一两年炙手可热的概念。电商零售行业等很多细分行业有很多专家经验,这些专家经验能不能沉淀在计算机系统里面,做一些数据挖掘?这时需要构建一个知识图谱,把行业的方方面面的知识和经验沉淀在知识图谱中,用这个知识图谱更好的分析数据,挖掘数据,指导各种各样的运营工作。
构建知识图谱是非常重要的一件事情,医药行业、生鲜行业、法律行业,每个行业都有自己的知识点,我们把这些整理起来以后建立一个行业知识图谱,为他们的行业更好的实现自动化运营服务。
文本挖掘引擎可以做很多事情,让计算机具备了阅读能力可以从大量的文档中抽取你要的信息,可以做审阅,可以做用户的意见分析,同样也可以衍生出像搜索,个性化推荐以及知识图谱等应用。
未来,电商借助人工智能技术可实现的趋势:
以前讲线上线下,以后不再分线上还是线下,而是数字化还是非数字化。
文本数据的自动化处理有很大意义,大量原先依赖人工的文本处理工作可以交给计算机系统来自动化进行,节约大量的人力,更好提高效率。
数据服务的价值将被越来越多的重视,靠行业经验的传统方式,将被通过知识图谱、用户意见分析等自动化系统来代替,更好地提升企业运营效率,更好地改进产品和服务。