2022-08-15 13:47 已编辑北京科技大学算法工程师

关注

算法面试高频知识点：KL散度和JS散度

图片说明

这是我之前写在公众号里的一篇文章，在此分享到牛客上，一来是希望能和牛客上的朋友们一起交流学习CV算法以及相应的知识。

KL散度

KL散度（Kullback-Leibler divergence），可以以称作相对熵（relative entropy）或信息散度（information divergence）。KL散度的理论意义在于度量两个概率分布之间的差异程度，当KL散度越高的时候，说明两者的差异程度越大；而当KL散度低的时候，则说明两者的差异程度小。如果两者相同的话，则该KL散度应该为0。

接下来我们举一个具体的例子：

我们设定两个概率分布分别为P和Q，在假定为连续随机变量的前提下，他们对应的概率密度函数分别为p(x)和q(x)。我们可以写出如下公式：

$KL(P||Q) = \int p(x)\log \frac{p(x)}{q(x)}dx$

从上面的公式可以看出，当且仅当P=Q时，KL(P||Q) = 0。此外我们也发现KL散度具备非负的特性，即P(P||Q) >= 0。但是从公式中我们也可以发现，Kl散度不具备对称性，也就是说P对于Q的KL散度并不等于Q对于P的KL散度。因此，KL散度并不是一个度量（metric）。

我们在来看看离散的情况下KL散度的公式：

$KL(P||Q) = \sum p(x)\log \frac{p(x)}{q(x)}$

接下来我们对上面的式子进行展开：

$KL(P||Q) = \sum p(x)\log \frac{p(x)}{q(x)} = -\sum p(x)\log(q(x)) + \sum p(x)\log(p(x)) = H(P,Q) - H(P)$

最后得到的第一项类似熵的形式，这一项称作P和Q的交叉熵（cross entropy），后面一项就是熵。

JS散度

在信息论中，熵代表着信息量，H(P)代表着基于P分布自身的编码长度，也就是最优的编码长度（最小字节数）。而H(P,Q)则代表着用P的分布去近似Q分布的信息，自然需要更多的编码长度。并且两个分布差异越大，需要的编码长度越大。所以两个值相减是大于等于0的一个值，代表冗余的编码长度，也就是两个分布差异的程度。所以KL散度在信息论中还可以称为相对熵（relative entropy）。

对深度学习中的生成模型来说，我们希望最小化真实数据分布与生成模型分布之间的KL散度，从而使得生成模型尽可能接近真实数据的分布。在实际实践中，我们是几乎不可能知道真实数据分布 $P_{data}(x)$ 的，我们使用训练数据形成的经验分布在逼近 $P_{data}(x)$ 。

JS散度全称Jensen-Shannon散度，我们这里简称JS散度。在概率统计中，JS散度也与前面提到的KL散度一样具备了测量两个概率分布相似程度的能力，它的计算方法基于KL散度，继承了KL散度的非负性等，==但有一点重要的不同，JS散度具备了对称性。==

JS散度的公式如下，我们设定两个概率分布为P和Q，另外我们还设定M = 0.5 * （P + Q），KL为KL散度公式。

$JSD(P||Q) = \frac{1}{2}KL(P||M) + \frac{1}{2}KL(Q||M)$

如果我们把KL散度公式打入展开的话，结果如下所示：

$JSD(P||Q) = \int p(x)\log \frac{p(x)}{\frac{p(x) +q(x)}{2}} dx+ \int q(x)\log \frac{q(x)}{\frac{p(x) +q(x)}{2}}dx$ #面经##秋招##实习##面试八股文##面霸的自我修养#

全部评论

推荐最新楼层

杀杀杀破狼

上海交通大学项目经理

确实是高频的知识点啊

点赞回复分享

发布于 2022-08-14 15:19

昨天 13:37

海康威视_算法研发部_AI算法工程师(准入职员工)

海康内推-海康内推码

岗位：武汉 嵌入式开发timeline：8.30 测评，10.9 一面，10.11 二面一面技术：自我介绍讲下实习经历平常怎么debug项目中有没有遇到什么问题，怎么解决的介绍一下学校经历了解数据结构吗？基本的数据结构？查找搜索效率？有什么方法可以提高效率？具体围绕数据结构问了很多RTOS，多任务操作反问：做存储固件的，具体的进来再分二面HR：北京线下，地点在北京研发中心，具体内容就是唠家常，一些HR面的基本问题销售工程师工作体验，总结累但成长很多。1.大家最先关注的就是HIK的工作压力，只能说体面厂没有辜负盛名！名不虚传！我来这边是销售岗，基本上每天都要差不多11点下班。因为销售不仅需要对接...

点赞评论收藏

分享

昨天 21:18

门头沟学院算法工程师

为什么选择华为OD：站在普通211/985学生的角度

作为一名普通211/985院校计算机专业的学生，面临的就业选择虽然有一些，但竞争依然十分激烈，尤其是在技术行业。很多同学都会考虑去大厂，甚至一些人可能直接目标就是那些互联网巨头，比如阿里、腾讯、字节等。但是，现实中，并不是每个人都能轻松进入这些大厂巨头的正编岗位。而当我看到华为OD这个岗位时，虽然它可能不如那些大厂的正编岗位薪资高、名气大，但我依然认为它是一个更好的选择。！！！我指的是华为od 不是软通动力中软那些普通外包外协，他俩是有很大区别的要，很多人把这个混在一起看！！！1. 华为OD vs 大厂正编岗位大厂正编：进入大厂的正编岗位，确实是很多同学的梦想，因为它代表着高薪、稳定的工作环境...

投递华为等公司10个岗位 > 找工作，你会甘心进小厂还是猛冲大厂大厂无回复，继续等待还是奔赴小厂

点赞评论收藏

分享

04-28 10:09

好莱坞大学院大学 C++

问个问题被阴阳怪气了

#游戏开发# #春招#

挣K存W养DOG：玩小红书玩的，觉得自己很幽默😅

点赞评论收藏

分享

03-20 12:22

门头沟学院 Java

梦碎了一大早破了个大防

牛客998737654号：没有hc了吧，但是我接到到后端的面试邀请

投递美团等公司10个岗位

点赞评论收藏

分享

05-05 18:04

门头沟学院 Java

黑马点评大总结

8.2.1 短信登录首先是用户提交手机号，后端将生成的验证码以及用户信息存入session中，用户登录时进行拦截并从session中拿出来信息校验，并把用户信息存入ThreadLocal中session共享问题：每个tomcat有自己的一份session，分布式、微服务下有多个tomcat实例，之间的session无法共享解决： 负载均衡器通过特定算法如IP哈西，保证同一用户的请求始终路由到同一服务器。（失去负载均衡的灵活性）session复制，所有服务器同步session变更。（带宽消耗大）集中存储，将会话数据存储在外部，如redis客户端存储。（安全性挑战）采用后端生成token存入red...

维密牛：javaguide太泛了，想面试突击的建议不要硬凿Guide费时间，我自己整理到飞书上的面经差不多一两周就能去面了😂需要的d一下就行，不要米

点赞评论收藏

分享

评论

2

3

招聘动态

招商金科

25届+26届校园招聘

完美世界

25届春招&26届实习生招聘

腾娱互动

26届实习生火热招聘中

字节跳动

25届补录&26届实习

联想

2026届实习招聘

26届实习软件笔试必刷题单

26届实习求职交流群

字节跳动Tik Tok

26届实习招聘

26届投递链接合集

快手

25届补录+26届实习

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 商战，最累的是我们 #

4898次浏览 22人参与

# 哪些公司校招卡第一学历 #

54963次浏览 210人参与

# 异地恋该为对方跳槽吗 #

12916次浏览 77人参与

# 硬件人更看重稳定还是高薪 #

28463次浏览 162人参与

# 职场新人生存指南 #

312935次浏览 6514人参与

# 国央企笔面经互助 #

124124次浏览 1068人参与

# 面试经验谈 #

5592次浏览 77人参与

# 诺瓦星云求职进展汇总 #

194180次浏览 1655人参与

# 租房找室友 #

21079次浏览 122人参与

# 硬件人秋招的第一个offer #

63740次浏览 1079人参与

# 学历or实习经历，哪个更重要 #

106271次浏览 732人参与

# 硬件人你反向读研了吗 #

37915次浏览 608人参与

# 得物求职进展汇总 #

90452次浏览 791人参与

# 机械人选offer，最看重什么？ #

87467次浏览 540人参与

# 秋招想进国企该如何准备 #

53782次浏览 354人参与

# 你上一次加班是什么时候？ #

57700次浏览 393人参与

# 大疆求职进展汇总 #

483742次浏览 3199人参与

# 机械求职避坑tips #

39340次浏览 352人参与

# 实习要如何选择和准备？ #

66505次浏览 1077人参与

# 产品面经 #

171434次浏览 1896人参与

牛客网
牛客企业服务