jianqiangyin
科技字节帝国

算法引擎与物理算力:四层漏斗推荐技术

解构抖音推荐系统的召回、粗排、精排、混排四层漏斗架构与在线实时打分逻辑。

抖音的推荐引擎到底是怎样设计工作的,具体实现形式

抖音的推荐引擎是一套极其精密的工业级系统,2025年抖音官方首次在"安全与信任中心"公开了其算法原理。下面从整体架构到核心模型,逐层拆解它是如何工作的。


整体流程:四层漏斗架构

抖音每天新增内容超过一亿条,推荐系统需要在海量视频中快速筛选出用户最可能感兴趣的内容。整个流程是一个从粗到精的漏斗,分为四个阶段:

  1. 召回(Retrieval):从百亿级视频库中,快速粗筛出数千条候选内容
  2. 粗排(Pre-Rank):用轻量模型初步打分,筛选至几百条
  3. 精排(Rank):用复杂大模型精细打分,选出几十条最优内容
  4. 混排/重排(Re-Rank):加入多样性、疲劳度、商业策略等约束,生成最终信息流

召回阶段:多路并行,快速粗筛

召回的核心任务是速度和覆盖度——允许粗糙,但不能漏掉好内容。抖音采用多路召回策略并行执行:

双塔召回模型(主力模型)

这是抖音最核心的召回技术。它的工作方式非常巧妙:

  • 用户塔:将用户的特征(历史观看、点赞、搜索、关注等)输入一个深度神经网络,输出一个高维向量("用户数字指纹")
  • 内容塔:将视频的特征(画面、音频、文本、作者信息等)输入另一个网络,输出一个高维向量("内容数字指纹")
  • 两个向量被放入同一个向量空间,通过计算向量距离(如点积或余弦相似度)判断匹配度——距离越近,匹配度越高
  • 关键优势:算法不需要理解内容的语义,只需处理纯粹的数学符号,就能找到深层关联

其他召回路

  • 协同过滤召回:找到和你兴趣相似的用户,把他们喜欢的内容推荐给你
  • 热度召回:补充全站热门内容,保证基础体验和新内容破圈
  • 社交召回:你关注的人互动过的内容
  • 多兴趣召回:通过用户行为识别多个兴趣标签,而非只盯着最明显的一个

精排阶段:核心打分引擎

精排是整个系统的算力核心,动用复杂的大模型对候选视频进行精细评分。

Wide&Deep 模型(主力模型)

这是抖音公开最多的核心模型,由 Google 提出,被抖音深度应用:

  • Wide 部分(记忆能力):单层线性模型,直接学习历史数据中物品或特征的"共现频率"。比如你过去总是看完猫咪视频,Wide 部分就"记住"这个强关联
  • Deep 部分(泛化能力):多层神经网络,通过 Embedding 层和多个隐层进行深层特征交叉,挖掘藏在特征背后的数据模式。比如它可能发现"喜欢猫咪的人也倾向于喜欢治愈系音乐",即使你从未搜索过这类内容
  • 两部分融合后输出最终排序分,既保证推荐的稳定性,又能发现用户的潜在兴趣

打分公式:行为概率 × 价值权重

抖音的核心排序逻辑可以用一个公式概括:

推荐优先级 = 预测用户行为概率 × 行为价值权重

具体来说,模型会同时预测你对一个视频的多种行为概率:

  • 完播概率
  • 点赞概率
  • 评论概率
  • 分享概率
  • 关注作者概率
  • 观看时长

每种行为有不同的价值权重(完播率权重最高,其次是评论、分享、点赞),加权求和得到综合期望价值(EV),得分最高的视频优先推荐。

值得注意的是,这些权重不是人工拍脑袋设定的,而是通过实验和回归模型自动学习得到的,量化每种行为对用户留存和复访的边际贡献。


混排阶段:打破"信息茧房"

精排输出的只是一个按分数排序的列表,直接推送会导致内容过于单一。混排阶段会加入多种约束:

  • 多样性打散:避免连续推荐高度相似的内容,主动穿插不同领域的视频
  • 疲劳度控制:同一作者或同类内容不会频繁出现
  • 探索机制:引入随机扰动(UCB算法、汤普森采样),让算法保持"好奇心",帮你发现新兴趣
  • 商业策略:广告插入
  • 内容治理:过滤违法违规内容

抖音还设计了**"兴趣时钟"**功能——根据你的活跃时间段调整推荐倾向,比如清晨推送新闻资讯类,晚间侧重娱乐放松类。


冷启动与实时性

  • 冷启动:新视频进入200-500人的初始流量池,系统根据完播率、点赞率、评论率等数据决定是否推入下一级流量池(3K→1W→10W→100W…逐级放大)。对于样本极少的新内容,采用贝叶斯平滑技术,避免因数据不足而误判。
  • 实时学习:你的每一次滑动、停留、点赞,都会在几秒到几分钟内更新模型参数,捕捉你最新的兴趣变化。

总结

抖音推荐引擎的本质可以概括为一句话:用数学计算学习人类行为,而非用标签定义用户。它不关心"你是谁",只关心"此刻你会做什么"。通过双塔召回快速匹配、Wide&Deep精细打分、多目标平衡和探索机制,在海量内容中为每个用户构建一条个性化的信息流通道。

这也是为什么当初字节跳动把这套推荐引擎注入 Musical.ly 后,用户停留时间直接翻倍——Musical.ly 有好产品,但缺的就是这套"读心术"级别的算法。

DATA SOURCE DECLARATION / 数据来源与真实性声明本文基础文本线索由千问大模型(Qwen)生成提取,并经由人工架构师与多模型交叉核查修正。受限于大语言模型的技术特性及训练集截断时效,部分数据预测与前瞻性战略推演仅代表系统生成时的逻辑映射,不构成任何精确的财务承诺、商业决策建议或法律依据。引用请注意时空错位风险。数据时效:截至 2025 年 11 月 | 核查与更新:2026 年 6 月 8 日

On this page