引言 很多人把网页端的推荐逻辑想得很玄乎,觉得那是一堆“黑箱规则”或“算法魔法”。把91网页版的推荐链路拆开来看,会发现核心非常朴素:用可量化...
我把91网页版的推荐逻辑拆给你看:其实一点都不玄学(这点太容易忽略)
热点追击
2026年02月27日 12:17 210
V5IfhMOK8g
引言 很多人把网页端的推荐逻辑想得很玄乎,觉得那是一堆“黑箱规则”或“算法魔法”。把91网页版的推荐链路拆开来看,会发现核心非常朴素:用可量化的信号把用户和内容匹配,并在工程约束下不断优化。下面把常见的模块、关键细节和实战可落地的建议全部铺开,便于产品/开发/数据团队快速实施或复盘。

推荐系统的目标与约束
- 直接目标:提高点击率、播放/停留时长、转化或留存等产品化指标。不同产品权重不同,推荐系统要对齐这些KPI。
- 约束条件:实时性(延迟)、计算成本、隐私/合规、内容审核和平台规则。任何设计都要在这些约束下折中。
核心信号(你能也该收集的)
- 用户层面:历史行为序列(点击、播放、停留、跳过)、订阅/收藏、设备与地区、登录状态、付费与非付费标识。
- 条目/内容层面:元信息(标签、时长、来源)、全局热度、生命周期(发布时间、上热门时间窗)、相似内容向量。
- 上下文层面:会话时长、访问入口(首页/频道/搜索)、时间段、页面位置(首屏/下拉)、A/B实验标记。
- 交互信号质量:区分短点(误触)和长点(真实兴趣),利用停留时长、二次播放等作为强化信号。
推荐链路拆解(从粗到细)
- Candidate generation(召回)
- 使用多路召回并集:基于热门榜、协同过滤(近邻)、内容相似(embedding)、规则召回(编辑推荐/专题)等。目的是高召回、低延迟。
- Scoring(打分)
- 用LR/GBDT/深度模型对每个候选项计算CTR/CTplay/留存预估分。特征包含用户、内容、上下文交叉特征。
- Re-ranking(重排)
- 在保证相关性的同时插入多样性、去重复、业务阈值(如变现位填充),以及位置衰减、互斥策略。
- Filters & Safety(过滤与安全)
- 内容审核规则、地域/年龄限制、违规屏蔽等先于上榜逻辑或作为后处理。
- Exposure logging(曝光日志)
- 精确记录曝光与交互,确保后续模型训练的标签可信(区分曝光/未曝光)。
冷启动与长尾问题
- 新内容:用内容特征(文本/图像/标签)做相似召回,或短期内推动到“新鲜”流量池以收集初始信号。
- 新用户:用入口信号(来源页、首次行为)、人口统计信息、及默认热门推荐作为起点,并尽快用少量实验探索偏好。
- 长尾内容:引入探索机制(epsilon-greedy、Thompson Sampling),有限地给长尾项曝光,防止热门垄断导致信息贫乏。
常被忽略但影响很大的细节
- Position bias:靠位置信息造成点击偏差,训练标签需用曝光归一化或采用因果矫正方法。
- 负样本质量:随机采样会混入未曝光的正样本,影响模型区分能力。优先使用点击失败样本或人为标注作为负样本。
- Session-level特征:把最近N条行为做序列化输入(RNN/Transformer/Seq2Seq)常能显著提升短期推荐效果。
- 曝光上限与频率控制:防止同一内容反复曝光导致用户厌倦或误判热门。
- 时间衰减与新鲜度:对时效性强的内容加短期权重,对长期价值内容加慢衰减。
- 业务规则的可解释性:给编辑/运营提供规则优先级/干预接口,便于做突发事件或活动期的人工调整。
评估与实验
- Offline指标:AUC、NDCG、MAP能反映模型排序能力,但和在线KPI(留存、转化)并非一一对应。
- Online实验:小流量灰度快速验证改动,观察主要与次要指标变动。
- 因果与探索:采用带探索的策略(bandit)在不损害线上体验的前提下持续收集有价值数据。
反作弊与健壮性
- 异常检测:异常流量、刷量行为、非人类行为识别,结合速率/行为序列/设备指纹。
- 抑制反馈螺旋:热门被更多曝光进而更热门,需用曝光归一化、去偏或设置冷却期来缓解。
可落地的8条建议(给工程/产品的清单)
- 明确主KPI并把模型训练目标对齐到该KPI。
- 建立覆盖面广的多路召回体系,保持召回池的多样性。
- 强化曝光日志的准确性,记录曝光-点击-时长的完整链路。
- 在模型训练中加入位置、时段等上下文特征并做偏差校正。
- 实现小流量线上探测策略(探索+安全阈值),给长尾内容机会。
- 把业务规则模块化,能随流量或活动实时启停。
- 周期性对负样本策略、标签时间窗进行复盘与更新。
- 常设A/B实验模板与异常报警,确保改动可回滚且可追踪。
相关文章
