达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

复旦卢暾:以人为中心的推荐系统模拟–大模型驱动的Agent建模方法

本文整理自11月23日达观大讲堂上复旦大学计算机学院教授、博导,上海市数据科学重点实验室副主任,复旦大学社会计算研究中心主任卢暾教授《以人为中心的推荐系统模拟——大模型驱动的Agent建模方法》的主题分享。

随着互联网和数字化技术的迅猛发展,推荐系统已经成为了许多在线平台和应用程序中不可或缺的一部分。传统的推荐系统主要基于机器学习和协同过滤等方法,通过分析用户行为和项目特征来提供个性化的推荐。然而,随着数据规模和复杂性的增加,传统方法在面对大量用户和项目,特别满足用户良好推荐体验上,存在较大局限性。因此,以人为中心的推荐系统逐渐引起了研究者和工程师们的关注。大模型驱动的Agent建模方法是实现以人为中心的推荐系统的一种重要方式。这种方法借助于强大的大规模语言模型,如GPT等,构建智能代理(Agent)。其可以对用户的查询和上下文进行深入理解,并利用大规模数据和深度学习技术提供高质量的推荐结果。这种建模方法通过模拟人类决策和个性化需求,可以更好地理解用户的行为和意图,从而提供更加智能和贴近用户期望的推荐。并且,通过将用户放在推荐系统的核心位置,这种方法可以有效地解决传统推荐系统中的一些挑战,并提供更加个性化和满足用户需求的推荐体验。

面临的问题和挑战

1. 复杂交织的期望价值目标

推荐系统需要满足用户的多样化和动态化需求。用户的期望价值目标包括个性化、多样性、时效性等方面的要求。然而,这些目标之间可能存在冲突,如个性化推荐可能导致信息过滤的问题,多样性推荐又可能降低了个性化程度。因此,实现这些复杂交织的目标是一个巨大的挑战。

2. 数据主导与支配的机制算法

推荐系统的核心在于对海量数据的处理和分析。传统方法主要依赖于机器学习和协同过滤等技术,但这些方法容易受限于数据的稀疏性和冷启动问题。此外,数据主导的算法往往会优先考虑热门和流行的项目,导致长尾项目的推荐效果不佳。因此,如何设计有效的算法来平衡数据驱动和用户需求之间的关系,是推荐系统领域需要解决的难题。

3. 极化的正反馈闭环放大效应

推荐系统中的正反馈效应是一把双刃剑。当用户接收到与自己兴趣相符的推荐时,会更愿意进行交互和消费,进而形成正向的反馈循环。然而,这种正反馈循环也可能导致信息过滤和舆论偏见的问题,使用户陷入“信息茧房”。如何在推荐过程中平衡正反馈效应,增强推荐的多样性和广度,是推荐系统需要面对的挑战之一。

4. 多环节无处不在的各种偏差

推荐系统涉及多个环节,包括数据收集、特征提取、模型训练和结果展示等。每个环节都可能引入各种偏差,如数据采样偏差、特征选择偏差、算法偏差等。这些偏差可能导致推荐结果的不准确性和不公平性。解决这些偏差问题需要综合考虑数据质量、算法可解释性和结果评估等方面的因素。

基于大模型Agent 的微观推荐系统框架RAH

1.微观层面临的问题挑战

在微观层面上,以人为中心的推荐系统在个性化需求多样性、兴趣演化时效性、隐私保护和解释透明度等方面面临着诸多挑战。解决这些挑战需要结合用户行为研究、隐私保护技术和解释性算法等多个领域的知识。通过不断创新和改进,以人为中心的推荐系统将能够更好地满足用户的个性化需求,并提供具有良好用户体验的推荐服务。

2.解决方法与启示

  • 以人为中心的推荐:对推荐系统进行改进,考虑用户的需求,提升用户的满意度
  • 大语言模型增强的推荐系统:基于大模型构建推荐系统,利用世界知识理解物品特征,利用推理能力实现个性化筛选和精细排序
  • 大语言模型驱动的智能体:明确大模型智能体的定义,提出设计框架,实现适配具体领域和场景的智能体

3.以人为中心的推荐框架RAH

RAH (Recsys-Assistant-Human) 是一个基于大模型Agent的推荐框架,旨在解决推荐系统中以人为中心的问题,例如降低用户负载、缓解推荐偏见、增强用户控制。RAH框架从人类用户的视角出发,核心思想就是增加个人助手Assistant,用于在推荐场景中协助人类用户。进一步说,在这个框架中,个人助手基于大语言模型的知识储备和推理能力,从用户行为中学习和理解用户的个性;然后,个人助手再根据用户的个性提供定制的操作。

在这个RAH框架下,个人助手能够代理用户并协助用户优化推荐系统、缓解偏见和增强用户对推荐结果和个人隐私的控制。每个助手都由几个基于LLM的智能体组成:

(1) 感知智能体:理解和解释推荐信息,包括Item特征和用户反馈的含义。

(2) 学习智能体:从用户行为中分析用户个性,并将它们存储在个性库中。

(3) 行动智能体:根据学到的个性执行操作,例如为用户过滤不喜欢的项目。

(4) 评判智能体:验证执行的操作是否与用户的偏好一致,并分析调整以减少差异。

(5) 反思智能体:审查和优化积累的个性,例如解决重复和冲突等问题。

此外,我们通过添加学习-行动-评判循环和反思机制来增强我们提出的助手与用户的一致性。在学习-行动-评判循环中,学习、行动和评判智能体合作处理用户操作,不断改进对用户个性的理解。这个迭代循环会一直持续下去,直到行动智能体准确地反映学到的个性。同时,反思机制使用反思智能体定期修订学到的个性,减少累计个性中存在的冗余和冲突。在我们的实验中,我们使用真实世界数据在三个推荐领域评估RAH框架。首先,我们发现学习-行动-评判循环和反思机制显著增强了个人助手与用户个性的对齐程度。第二个实验表明这些代理操作可以协助用户调优推荐系统,减少了用户的交互次数,降低用户的操作负担。此外,在第三部分实验,我们研究了使用经过对用户个性学习的助手来代理用户对低流行度Item的反馈,缓解选择偏见,从而减轻系统中的偏见。最后,我们研究发现了RAH框架在解决与用户控制相关的问题时的潜力,包括通过二次过滤来帮助用户控制推荐结果,以及调整推荐系统对用户敏感数据的可见性来控制个人隐私。

预训练大模型驱动的宏观模拟系统SimuLine

1.宏观层面临的问题挑战

以人为中心的推荐系统在宏观层面面临着社会影响、公平性、信息多样性和隐私安全等方面的挑战。解决这些挑战需要从技术、政策和法律等多个角度进行思考和创新。推荐系统的发展应注重用户的长期利益和社会效益,在个性化推荐的同时保持公平、多样和可持续的推荐环境。

2.解决方法与启示

  • 基础工作:合成数据生成For Synthetic Data。学习数据分布,并面向特殊推荐场景或需求生成数据集
  • 方向一:面向模型训练的模拟器For Model Training of RecSys。通过框架定义数据分布学习,将静态数据增强为动态生成的多轮交互数据,进而实现面向用户多轮交互效用的推荐算法优化
  • 方向二:面向推荐系统社会影响的模拟器For Social Impact of RecSys。针对推荐系统长期交互过程中所产生的特定社会问题,基于Agent based Modeling 等建模方法设计有针对性的模拟框架,重现研究所关注的相关现象,并使用模拟数据予以解释

3.宏观模拟系统SimuLine

SimuLine是一个基于预训练大模型的推荐宏观模拟系统,旨在解决推荐系统中面临的问题和挑战,并提供更准确、全面和多样化的推荐体验。该系统通过强大的模拟能力和大规模数据驱动,为用户提供个性化、实时和多维度的推荐结果。其核心是一个预训练的大模型,具备深度学习技术和自然语言处理能力。这个模型经过大量数据的训练,能够理解和捕捉用户的兴趣偏好、行为模式和语义信息。它能够对用户进行精确建模,并从海量数据中挖掘潜在的关联和推荐机会。该系统还具备强大的模拟能力,可以模拟用户的兴趣演化和行为变化。SimuLine考虑到用户的兴趣和需求是动态变化的,可能受到季节性、时事热点或个人发展等因素的影响。因此,该系统能够模拟用户在不同场景和时间段的兴趣变化,及时调整推荐策略,提供与用户当前兴趣相关的推荐结果。此外,SimuLine注重推荐的多维度性。它不仅考虑用户的个人兴趣,还将其他因素融入推荐过程,如社交关系、地理位置、时效性需求等。这使得推荐结果更加全面和多样化,能够满足不同用户的个性化需求。SimuLine还关注隐私保护和用户参与。系统采取严格的隐私保护措施,对用户的个人信息和行为数据进行安全处理。同时,该系统提供用户参与推荐过程的机制,例如用户可以主动指定偏好、提供反馈和评价推荐结果,从而增强用户对推荐算法的参与感和信任度。

 

未来展望:技术发展与治理趋势

在大模型时代,复杂系统模拟的发展对于“以人为中心的推荐系统”变得更加重要。这是因为大模型不仅能够处理和分析海量数据,还能通过深度学习技术理解人类行为和需求,从而提供更准确、个性化的推荐服务。”以人为中心的推荐系统”的主题突出了用户体验和参与的重要性。随着大模型的兴起,可以更好地理解用户的兴趣、偏好和行为模式,从而根据个体的需求进行更精准的推荐。这种个性化的推荐有助于提高用户满意度,并增强他们对推荐系统的信任。此外,大模型可帮助推荐系统更好地理解和模拟人类行为的复杂性。它们能够捕捉到用户的动态兴趣演化、情感变化和社交互动等方面的特征。通过模拟复杂系统中的各种因素和相互作用,这些模型能够更准确地预测用户的行为和需求,为其提供更加个性化的推荐。然而,在利用大模型进行复杂系统模拟时,也需要注重“以人为中心”的原则。这意味着系统应该确保用户的隐私和数据安全,并提供可解释性的推荐结果。用户应该有权选择参与推荐过程,并对推荐结果进行反馈和调整。此外,公平性也是一个重要的考虑因素,推荐系统应该避免偏见和歧视,确保每个用户都能获得公正和中立的待遇。因此,在实现这些目标的同时,也需要关注用户体验、隐私保护、参与机制和公平性等方面,以确保推荐系统真正以人为中心,并提供积极的社会影响。

感谢上述两个工作的共同作者:张光平、舒钰博、张鹏、尚笠、顾宁(复旦),李东胜(MSRA)

相关论文:

[1] Yubo Shu, Haonan Zhang, Hansu Gu, Peng Zhang, Tun Lu, Dongsheng Li, Ning Gu. (2023) RAH! RecSys-Assistant-Human: A Human-Centered Recommendation Framework with LLM Agents, arXiv:2308.09904.

[2] Guangping Zhang, Dongsheng Li, Hansu Gu, Tun Lu, Li Shang. Ning Gu. (2023) Simulating News Recommendation Ecosystem for Fun and Profit. arXiv preprint arXiv:2305.14103.