达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

4招有效解决推荐系统冷启动难题

什么是智能推荐

智能推荐根据用户每个人的性别、年龄、爱好等维度塑造的静态用户画像,和用户每一次点击、点赞、评论、收藏等行为数据形成的动态用户画像相结合,来结合挖掘用户深层次兴趣需求维度。再借助产品的信息,从大量产品信息中找到用户感兴趣的产品推送出去。简而言之,智能推荐是根据用户的历史行为和兴趣预测用户未来的行为和兴趣。
所以大量的用户行为数据成为推荐系统的重要组成部分和先决条件,如何在没有大量用户数据的情况下设计个性化推荐系统,并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动的问题。

什么是冷启动

冷启动问题主要分为3类:
  1. 用户冷启动:主要解决如何给新用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
  2. 物品冷启动:主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
  3. 系统冷启动:系统冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。

知道了什么是冷启动,接下来提供几种解决方案:

热门榜单推荐

现有的数据可以根据热度排序形成产品的热门榜单,给刚进来的用户推荐,等到用户行为数据收集到一定程度的时候,再切换个性化推荐。

pic_002

利用用户注册信息

根据用户注册时候提供的性别、年龄、职业等数据可以做粗粒度的个性化,推荐相关性高的产品。基于注册信息的个性化推荐流程基本如下:

  1. 获取用户的注册信息
  2. 根据用户的注册信息对用户分类
  3. 给用户推荐他所属分类中用户喜欢的物品

例如,刚进入的用户性别是女,年龄25岁,财务人员。查询3张离线计算好的相关表:一张是性别-书籍相关表,从中可以查询女性最喜欢的书籍;一张是年龄-书籍相关表,从中可以查询到25岁用户最喜欢的书籍;一张是职业-书籍相关表,可以查询到财务人员最喜欢的书籍。

最后,我们可以将这3张相关表查询出的书籍列表按照一定权重相加,得到给用户的最终推荐列表:25岁女性白领喜欢的书籍

 

用户登录自选标签

要求用户登录时选择一个或者多个标签,然后收集整理用户感兴趣的范围,去推荐相关性高的内容和商品。

这个方法现在很常见,新用户进来之后需要选择自己喜欢的分类或内容,后面再推荐相关的产品信息。

pic_003

利用物品的内容信息

利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户,解决了如何将新加入的物品推荐给对它感兴趣的用户的问题。

不过当新物品加入时,内存中的物品相关表中不会存在这个物品,从而无法推荐新的物品。解决这一问题的办法是频繁更新物品相似度表

达观智能推荐

达观智能推荐系统,是达观数据自主研发的智能推荐引擎,结合自研的NLP(自然语言处理)技术,完成对用户行为、推荐产品的语义分析,实现“千人千面”的个性化推荐服务。 

达观智能推荐引擎,是一个经过长期技术积累以及市场打磨的成熟推荐产品,已经为各行各业数百家企业提供智能推荐服务,帮助各个企业提升产品价值。达观智能推荐引擎有如下优势:

  1. 产品成熟:达观智能推荐引擎是一个稳定、高效的成熟产品,推荐引擎自主研发,并且提供功能强大的后台配置系统,可以随时观察推荐效果、调整推荐策略,摒弃传统黑盒模式,让客户看得见,摸得着。
  2. 技术实力:达观推荐技术团队成员,技术过硬,有着多年推荐产品开发的经验以及推荐算法调优经验,并在EMI数据科学黑客马拉松大赛和KDD CUP国际知识发现和数据挖掘竞赛中多次获得优异成绩。
  3. 冷启动经验丰富:无论是新用户、新物品、新系统,冷启动的问题都不可避免。达观智能推荐系统,通过自研算法,结合NLP技术,快速建立画像,有效缓解冷启动的问题。
  4. 快速见效:达观智能推荐产品,拥有不同的交付方式。可以根据企业所需,提供SAAS服务,也可进行私有化部署。但是无论形式如何,周期短,见效快。完成数据上报之后,1-2周即可见效,开箱即用。
  5. 丰富的行业经验:达观智能推荐产品,已经服务了金融、电商、资讯、直播等等不同行业数百家客户,并且支持多平台,包括app、pc、web等。针对不同场景都具有丰富的工程化经验,可以帮助企业梳理推荐思路,对症下药。