达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

重排机制:破除推荐单一困境,满足用户多元需求渴望

当今竞争激烈的互联网环境中,推荐系统的重排环节对于提升用户体验和平台竞争力起着至关重要的作用。有效的重排机制能够将推荐从单一的相关性提升到兼顾多样性与新颖性,从而更好地满足用户复杂多变的需求,增强用户对平台的喜爱与依赖。达观数据智能推荐在重排机制方面积累了很多经验,下文将进行分享。

 

一、重排算法设计  

(一)基于规则的重排策略

1. 热门物品打散规则

为避免推荐列表被热门物品垄断,可设定规则。例如,在每 10 个推荐位中,热门物品最多出现 3 次,且相邻热门物品间隔至少 2 个推荐位。这样能让冷门但有潜力的物品有更多展示机会,增加推荐的多样性。比如在新闻推荐中,热门时政新闻不会连续扎堆出现,而是穿插着经济、文化等不同领域新闻。

2. 类别平衡规则

依据物品类别进行重排,确保推荐列表丰富性。要求每个推荐批次中至少涵盖 3 种不同类别物品。若用户历史浏览中科技类占比 40%、娱乐类 30%、生活类 30%,则重排时适当降低科技类占比,提高娱乐与生活类出现概率,使推荐不局限于单一类别。

 

(二)基于模型的重排方法

1. 序列到序列模型应用

– 模型架构解析:序列到序列模型的编码器可对候选物品序列编码,解码器依据编码信息生成重排后的推荐序列。如在电商推荐中,编码器将候选商品的特征序列编码,解码器根据用户历史购买序列信息,生成更符合用户兴趣序列的推荐商品顺序。

– 训练与优化技巧:数据预处理时,对稀疏特征进行嵌入处理。采用交叉熵损失函数与梯度下降算法训练,设置学习率衰减策略防止过拟合。

2. 强化学习模型运用

– 奖励函数设计:奖励函数综合考量多样性、相关性与用户反馈。若推荐物品增加了列表多样性且被用户点击,给予较高奖励。如在视频推荐中,推荐了与用户历史观看不同类型且被观看的视频,奖励值提升。

– 探索与利用策略:采用 ε – 贪婪策略,以一定概率 ε 探索新推荐组合,1 – ε 概率利用已有成功经验。在音乐推荐初期,高概率探索新风格音乐组合,后期稳定时,多利用已成功的推荐策略,优化推荐顺序。  

 

二、多样性与新颖性优化  

(一)多样性指标衡量

1. 内容多样性计算方法:通过计算不同类别物品在推荐列表所占比例的熵值衡量内容多样性。设定熵值阈值,若低于阈值则重排策略需调整。例如在商品推荐中,若某推荐列表中服装类占比过高,熵值低,需调整重排使家居、数码等其他类别物品合理分布。

2. 用户感知多样性评估:从用户浏览行为分析感知多样性。若用户频繁切换不同类别物品浏览,说明感知多样性高。可通过用户浏览深度、切换频率等数据加权计算感知多样性得分,纳入重排优化目标。  

(二)新颖性提升策略

1. 挖掘长尾物品

利用数据挖掘分析物品流行度分布,识别长尾物品。给予长尾物品推荐权重提升或设专门推荐通道。如在电影推荐中,小众文艺片为长尾物品,通过分析用户对不同类型电影评分数据,挖掘出此类长尾电影,增加其在推荐列表曝光机会。

2. 引入新趋势物品

监测社交媒体、行业新闻获取新趋势信息,建立新趋势物品库。采用基于内容或协同过滤算法推荐给潜在感兴趣用户。

 

三、用户兴趣与习惯分析  

(一)用户兴趣建模

1. 多源数据融合:整合用户历史行为、社交关系、人口统计学等数据构建兴趣模型。利用协同过滤结合社交关系挖掘潜在兴趣,考虑年龄、性别等人口统计学特征影响。如年轻女性用户社交圈中多人关注美妆,且自身浏览历史有相关记录,模型则强化美妆类推荐权重。

2. 兴趣动态更新:依据时间衰减函数对不同时间行为数据加权,重点关注近期行为更新兴趣模型。例如用户近期频繁搜索旅游信息,之前关注美食,模型则快速调整推荐重点为旅游相关内容,适应兴趣变化。  

 

(二)用户习惯分析与适配

1. 浏览习惯分析

分析用户浏览时间分布、路径、速度等习惯。若用户在晚上浏览量高,重排时优先推荐适合晚上浏览的内容,如轻松娱乐或深度阅读文章;对浏览速度快的用户,简化推荐列表展示,突出关键信息,提高浏览效率。 2. 交互习惯分析

研究用户点击、评论、收藏等交互习惯。对喜欢点击图片的用户,推荐列表放大图片展示;对常评论的用户,推荐有争议性或话题性物品,促进互动,提升用户参与感与平台粘性。  

 

四、重排效果评估与调整  

(一)评估指标体系构建

1. 多样性相关指标

除内容多样性指标,基尼系数衡量物品分布均匀性。若基尼系数过高,说明部分物品过度推荐,需优化重排。同时结合用户对推荐列表多样性满意度评分,全面评估多样性提升效果。

2. 相关性与转化率指标

采用 CTR、CVR 评估推荐与用户兴趣匹配及行为转化效果。在推荐商品时,若重排后 CTR 大幅下降,需检查相关性是否受影响,确保多样性提升不以牺牲相关性为代价。

3. 用户留存与活跃度指标

通过用户留存率、登录频率、使用时长等评估对用户长期使用平台意愿的影响。若重排策略实施后,用户留存率上升、活跃度提高,说明策略有效,反之则需调整。

 

(二)持续优化流程

1. 问题诊断

依据评估指标,分析重排策略问题。若多样性不足,可能是规则限制过严或模型未充分学习;相关性下降,可能是用户兴趣模型更新不及时;用户留存率未提升,可能是未兼顾用户长期与短期需求。

2. 策略调整

针对问题调整策略。若多样性不足,放宽规则或增加模型训练数据;相关性下降,优化兴趣模型更新机制;用户留存率低,平衡短期吸引与长期价值挖掘,然后再次评估,形成持续优化闭环。

达观数据的重排算法,成功地将热门物品与小众精品巧妙融合,显著提升了推荐多样性。在丰富用户推荐体验的同时,为企业业务增长注入强劲动力。