笔记-概率论

1.precision,accuracy,sensity, Specificity。

2.二分类问题当负样本下采样的时候,模型的最终概率修正。

比如y为0或1,当对样本的负样本,比如0的样本只取20%,这会改变p(y|x), 因为同样的x下,y=1和y=0的相对数量变了。

重点:采样本身对特征的条件分布 P(x∣y)P(x∣y) 没有改变(前提是假设你的采样和 x 无关,即随机抽取某一类的样本,不是基于 x 进行抽样),而x相对y的分布却没有变,因为假如对于y=1和y=0来说有两个不同的分布,而当其中的一些y=0的例子被去掉的时候,其相对应的x也被去掉了,并不会改变原本其x的分布。

P真实​=rp/((1−p)+rp)​​

3.置信区间

4.古典概型

5.变异系数(CV)

 

μ/σ​

标准差与均值的比值(单位无关)

6.SVM

7.GBDT

Bias = “平均预测”离真值远

Variance = “预测结果”不稳定

🧠 Boosting 降 Bias,让模型更聪明

🎲 Bagging 降 Variance,让模型更稳健

8.LR sigmoid

9.多层感知器

10.拉格朗日函数

因为原函数满足极值的条件,恰好等于一个拉格朗日函数求导=0,所以直接对原函数求导就是原函数极值点。

11.当离散随机变量 XX 的熵H(X)=−∑iP(xi)log⁡P(xi)H(X)=−i∑​P(xi​)logP(xi​)的值逐渐升高时,意味着:

主要含义

  1. 不确定性增加熵越大,说明对 XX 的结果越不确定,越难预测。
  2. 概率分布趋于均匀熵最大时,概率分布是完全均匀的,即每个可能取值出现的概率相等。
  3. 信息量增大每次观察结果平均包含的信息量更多。
全部评论

相关推荐

通常周五mentor会预告本周工作,周一周会上通常也会给出大致方向。每周一梳理好本周要完成的工作,为写周报做铺垫,避免写周报的时候脑袋空空无处下笔。同理,每天早上需要排列清楚需求的优先级,事情一件一件做,不要做A的时候产生B想法就去做B了,在各种事情之间反复横跳,会一件事都做不好,感觉每天一直在忙,但无所产出,挫伤工作积极性。避免白天工作摸鱼导致晚上加班,摸鱼聊天的时候可能没啥感受,但是一天累积摸鱼的时间累积起来,已经可以让自己早下班一小时了。工作太积极只会有干不完的活,要考虑自己身心承受能力,通过装傻装脆皮或直接拒绝分外的工作,努力争取有成长性的工作。我已经早9晚20了,晚上回家还要搞学校的事情,拒绝额外加班,即使新增任务能让我学到东西。有问题主动问,不要因为害怕打扰mentor而憋着,不让mentor帮忙把关,容易返工。无关紧要的问题可以攒着,等周会一起问。每次完成新的任务后,梳理好SOP。有了备份,下次忘了如何操作时可以直接照抄,如果有人问你,也避免再花时间解释。对于dirty想办法流程化,总结sop。如果一件事不得不做,要想办法从中学到东西,让自己的时间花得有价值。珍惜能够学到领导力的工作,在工作中总结一套带团队的方法论,包括用什么利益点来push大家干活,如何让团队成员感受到工作价值,如何唤醒装死/流失用户……每个人都有自己特质,取人之长,补己之短。我心直口快,喜欢总结,经常想到什么说什么,没有经历过的事情,可能考虑得没有那么深思熟虑。时刻留个后手,永远不要让主动权掌握在别人手中。警惕学生思维,在学校里爽约没什么风险,但出社会就不一定了。有博主周末和hr说要推迟2天入职后,hr工作日回复另找他人了。下面有个从hr角度出发的高赞评论,说博主应该在和hr商定日期的时候,提前确认好毕业答辩时间、拍毕业照的时间,为入职留出一定的缓冲时间。好不容易招到人却突然要比规定时间晚来2天,万一不来了hr是要要背负骂名的,只能在周末加班快速去找备胎,重新发起入职审批流程。职场中要带着问题和答案去向上汇报,不要想到什么就说什么,要完成一个逻辑闭环。   
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务