清华与快手联手:从价值观切入,让推荐算法更懂用户需求促多业务增长

   发布时间:2026-05-30 05:20 作者:冯璃月

在推荐算法领域持续深耕的当下,行业正积极探索新的增长路径。短视频推荐系统历经多年发展,在协同过滤、序列推荐、多目标优化等技术方向上已取得显著进展。然而,随着现有技术体系逐渐成熟,通过优化模型结构、开发常规特征以及学习可观测目标来提升效能的方式,效果日益有限,行业迫切需要创新的研究思路。

清华大学经济管理学院的研究团队与快手消费策略算法部展开合作,开展了一项颇具创新性的联合实验。该实验从视频传递的价值观角度出发,深入探究用户观看视频后的行为和心理变化。研究团队借助大模型的模拟与推理能力,将社会学和心理学领域的价值观理论引入推荐排序策略,并在快手主站开展了大规模随机在线对比实验。初步成果显示,这一研究方向不仅在技术层面具备可行性,还在用户使用时长、电商、直播、社交、搜索等多个业务维度实现了同步增长,实现了推荐系统在社会价值观层面通过算法满足用户需求的创新功能。

将抽象的价值观概念从理论转化为推荐系统的实际应用,是该项目的核心挑战之一。研究团队基于前期合作成果,分两个阶段构建了完整解决方案,即视频价值的大模型推理以及轻量蒸馏模型线上生效,将离线实验验证的方法论转化为真实推荐系统的策略工具。

在大语言模型推理阶段,研究团队利用大语言模型模拟短视频受众群体,推理不同类型用户观看视频后的行为和心理变化,进而推断用户感知到的价值观。这一推理流程针对随机采样的视频展开,采样视频时间跨度达6个月,数量累计超过650万条,基本覆盖了所有类目。

为应对每天海量视频的理解需求,研究团队进一步完成了蒸馏模型的规模化部署。该模型以快手自研的视频embedding为特征,以大模型推理结果为监督信号,训练轻量级蒸馏模型。通过这种方式,将大模型强大的受众模拟和价值观推理能力迁移到可实时在线高通量服务的小模型中,实现对全量视频的价值观标签预估,从而具备多场景规模化应用的能力。离线测试表明,充分训练后的蒸馏小模型准确率可达85%以上,人工评测也认为其与大模型推理结果无明显差异,满足线上落地需求。

然而,视频价值标签预估结果在线上推荐系统生效时,面临新的挑战,即视频价值与用户可观测反馈关联的不确定性。尽管前期离线实验已验证视频价值推理结果能有效提升视频排序准确率,但线上真实场景中用户反馈信号多样,包括APP时长、点赞、关注、打赏、长期留存等,且目前尚无理论论证这些反馈信号与视频价值的相关性和互补性。不同推荐业务场景下,由于作者生态和消费者群体不同,价值内容也存在明显差异,因此只有通过完整的线上对比试验,才能准确判断系统隐藏的价值需求和短板。

实验在快手主站精选页的重排阶段进行,采用经典A/B实验范式。实验规模为每组约5%流量,覆盖千万级用户群体,实验周期包括一周的AA期观察和超过一个月的AB实验。在实验干预方面,每个实验组在重排阶段适度提升某一类价值观视频的分发权重,观察对各业务指标的影响。

初步实验结果令人瞩目,价值观调控对多个业务板块产生了积极影响,且不同价值观与多业务指标的关联存在差异。在内容消费方面,个人安全组显著提升了用户APP使用时长及留存指标;直播业务中,多个价值观组别,如个人安全、传统、仁慈 - 关怀等,对直播送礼金额有显著正向影响;电商业务里,享乐主义、个人安全、社会安全等价值观组别对大盘结算GMV有明显正向贡献,买家数也同步增长;社交互动方面,多个价值观组别显著提升了双关用户的内容互动与分享行为,改善了平台社交活跃度;主动搜索方面,大多数实验组显著提升了用户主动搜索次数,其中刺激类价值观视频的提升幅度最为突出。

这一系列实验结果背后,蕴含着两个值得深入思考的发现。其一,供需平衡需求。原有的推荐分发策略主要以主题作为内容的主要表征维度,视频的价值观属性在分发过程中未被显式考量。这意味着某些价值观类型的视频在平台上的供给比例可能长期低于用户的潜在需求,当主动提升这类内容的分发权重时,用户的正向反馈便会随之而来。其二,价值观的行为驱动力。研究在全体用户层面统一提升某类价值观视频的曝光比例,实验结果表明,特定价值观维度的内容在大盘层面更容易激发用户的观看、互动与转化行为。这一发现将社会心理学中成熟的价值观理论与推荐系统的内容理解问题相连接,同时也为价值观理论本身提供了新的经验证据,即在数字内容消费这一大规模真实场景下,不同价值观类型对人类行为的影响存在因果性、系统性差异,这是以往依赖问卷或小样本实验的价值观研究所难以探讨的问题。

 
 
更多>同类内容
全站最新
热门内容
本栏最新