算法引擎与物理算力:推荐算法的数学基石
梳理深度神经网络、UCB算法、汤普森采样及贝叶斯平滑等核心技术的百年数学发现史。
其中提到了几个关键技术,深度神经网络、UCB算法、汤普森采样、贝叶斯平滑技术、向量等,这些底层基础理论都有哪些?都有哪些人什么时候发明的?
这些都是推荐系统背后非常经典的数学和计算机科学理论,我来逐一梳理它们的底层基础、发明者和时间线。
深度神经网络(Deep Neural Network)
深度神经网络并非一人一时之功,而是经过几代研究者接力完成的:
- 1943年:生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts)提出M-P神经元模型,为人工神经网络奠定了数学基础。
- 1958年:心理学家弗兰克·罗森布拉特(Frank Rosenblatt)发明感知机(Perceptron),首次实现单层神经网络的训练。
- 1969年:**马文·明斯基(Marvin Minsky)**指出感知机无法解决XOR问题,神经网络研究进入"第一次寒冬"。
- 1986年:大卫·鲁梅尔哈特(David Rumelhart)、杰弗里·辛顿(Geoffrey Hinton)和罗纳德·威廉姆斯(Ronald Williams)系统阐述了反向传播算法(Backpropagation),使多层神经网络的训练成为可能,神经网络研究复兴。
- 1997年:塞普·霍赫赖特(Sepp Hochreiter)和于尔根·施密德胡伯(Jürgen Schmidhuber)提出LSTM,解决了循环神经网络的梯度消失问题。
- 2006年:辛顿等人提出深度信念网络(DBN),通过"无监督预训练+监督微调"解决了深层网络训练难题,标志着"深度学习"时代的正式开启。
- 2012年:辛顿的学生亚历克斯·克里热夫斯基(Alex Krizhevsky)设计AlexNet,在ImageNet竞赛中大胜,引爆深度学习革命。
2018年,辛顿、杨立昆(Yann LeCun)、约书亚·本吉奥(Yoshua Bengio)三人因在深度学习领域的奠基性贡献共同获得图灵奖,被公认为"深度学习三巨头"。
UCB算法(Upper Confidence Bound)
UCB算法解决的是经典的**"探索-利用"困境**(Exploration-Exploitation Dilemma),其理论基础来自多臂老虎机问题(Multi-Armed Bandit):
- 1933年:统计学家**威廉·汤普森(William R. Thompson)**最早对多臂老虎机问题做出重要贡献,提出了后来被称为"汤普森采样"的方法。
- 1985年:**赖天舒(Tze Leung Lai)和赫伯特·罗宾斯(Herbert Robbins)**发表了关于渐近高效自适应分配规则的里程碑论文,为UCB奠定了理论基础。
- 2002年:彼得·奥尔(Peter Auer)、尼科洛·塞萨-比安奇(Nicolò Cesa-Bianchi)和约阿夫·弗罗因德(Yoav Freund)正式提出了UCB算法,给出了严格的理论遗憾界(O(K log T)),成为多臂老虎机领域最经典的算法之一。
UCB的核心思想基于霍夫丁不等式(Hoeffding's Inequality)——一个1963年由**瓦西里·霍夫丁(Wassily Hoeffding)**提出的概率论经典结论,用于量化随机变量偏离其期望值的概率上界。
汤普森采样(Thompson Sampling)
- 1933年:英国统计学家**威廉·汤普森(William R. Thompson)**在论文《On the Likelihood that One Unknown Probability Exceeds Another in View of the Evidence of Two Samples》中首次提出该算法,发表在《Biometrika》期刊上。
汤普森采样的核心思想是贝叶斯推断:为每个选项(如每个视频)维护一个后验概率分布(通常用Beta分布),每次决策时从每个分布中随机采样,选择采样值最高的选项。这种方法天然地平衡了探索与利用——不确定性高的选项分布更宽,更容易被采样到(探索);表现好的选项采样值倾向于更高(利用)。
虽然提出很早,但汤普森采样在提出后长期被忽视,直到2010年代才被史蒂夫·斯科特(Steve Scott)、奥利维尔·沙佩尔(Olivier Chapelle)、**李航(Lihong Li)**等人重新发掘,并在谷歌、微软等公司的在线广告和推荐系统中大规模应用,被证明在实践中往往优于UCB。
贝叶斯平滑(Bayesian Smoothing)
贝叶斯平滑的底层理论可以追溯到两个经典理论:
贝叶斯定理
- 18世纪:英国数学家、牧师托马斯·贝叶斯(Thomas Bayes)提出贝叶斯定理,描述如何根据新证据更新对事件概率的信念。贝叶斯去世后,其朋友**理查德·普莱斯(Richard Price)整理并发表了这篇论文(1763年)。后来皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace)**独立重新发现并推广了这一理论。
拉普拉斯平滑(Laplace Smoothing)
- 18世纪末-19世纪初:法国数学家拉普拉斯提出**"加1平滑"**方法,用于解决概率估计中的"零概率问题"——即某个事件在训练数据中从未出现时,不应将其概率估计为0。
在推荐系统中的贝叶斯平滑,具体做法是用Beta分布对二项分布的参数(如点击率)进行平滑估计。当某个视频的曝光次数很少时,直接用"点击数/曝光数"估计点击率极不可靠,贝叶斯平滑会将估计值向全局平均值"收缩",公式为:
平滑后CTR = (点击数 + α) / (曝光数 + α + β)
其中α和β是通过最大化似然函数从全局数据中学习得到的超参数。
向量与向量空间模型
这里涉及两个层面:
向量的数学理论
- 1844年:德国数学家赫尔曼·格拉斯曼(Hermann Grassmann)首次提出向量空间的抽象概念。
- 1888年:意大利数学家**朱塞佩·佩亚诺(Giuseppe Peano)**以公理化形式给出了向量空间的现代定义。
- 1918年:德国数学家**赫尔曼·外尔(Hermann Weyl)**在其著作《空间-时间-物质》中将向量空间概念应用于广义相对论,使其被广泛接受。
向量空间模型(信息检索领域)
- 1960年代末-1970年代:美国计算机科学家杰拉德·索尔顿(Gerard Salton)在康奈尔大学提出向量空间模型(Vector Space Model, VSM),并成功应用于著名的SMART文本检索系统。索尔顿因此被誉为**"现代信息检索之父"**。
在推荐系统中,"双塔模型"将用户和视频分别映射到同一个高维向量空间中,通过计算向量间的余弦相似度来判断匹配程度——这正是向量空间模型思想的直接应用。
总结一览
| 技术 | 核心发明者 | 提出时间 | 底层理论基础 |
|---|---|---|---|
| 深度神经网络 | McCulloch & Pitts → Hinton等 | 1943年奠基,2006年正式诞生 | 人工神经元模型、反向传播算法 |
| UCB算法 | Auer, Cesa-Bianchi, Freund | 2002年 | 多臂老虎机问题、霍夫丁不等式 |
| 汤普森采样 | William R. Thompson | 1933年 | 贝叶斯推断、Beta分布 |
| 贝叶斯平滑 | Bayes / Laplace | 18世纪 | 贝叶斯定理、拉普拉斯平滑 |
| 向量空间模型 | Gerard Salton | 1960年代末 | 线性代数中的向量空间理论 |
可以看到,抖音推荐引擎看似"黑盒",但其底层依赖的数学理论跨越了近300年的学术积累——从18世纪的贝叶斯定理,到20世纪的向量空间和信息检索理论,再到21世纪的深度学习革命。正是这些经典理论的组合应用,才造就了今天"千人千面"的个性化推荐体验。
DATA SOURCE DECLARATION / 数据来源与真实性声明本文基础文本线索由千问大模型(Qwen)生成提取,并经由人工架构师与多模型交叉核查修正。受限于大语言模型的技术特性及训练集截断时效,部分数据预测与前瞻性战略推演仅代表系统生成时的逻辑映射,不构成任何精确的财务承诺、商业决策建议或法律依据。引用请注意时空错位风险。数据时效:截至 2025 年 11 月 | 核查与更新:2026 年 6 月 8 日