2023-06-16 15:00 知乎_产品

关注

Day42：概率论与统计学基础知识

alt

我们前面讲过了，机器学习是基于统计学的诞生的，因此当涉及到机器学习时，概率论和统计学是非常重要的基础知识。下面我们就简要介绍一些必要的概率统计学知识。

1. 概率论

1.1事件与概率

事件是指样本空间中的一个子集，概率是事件发生的可能性的度量，比如说我们投掷一枚均匀的硬币，出现的正面的可能性是1/2。

我们也可以用代码来表示，生成一个随机数，判断该随机数小于0.5的情况：
```
import random

# 生成一个随机数
num = random.random()
print("随机数：", num)

# 通过比较判断事件发生与否
if num < 0.5:
    print("事件发生")
else:
    print("事件不发生")
```

1.2 随机变量与概率分布

随机变量是对样本空间中的每个样本赋予的一个数值，概率分布描述了随机变量取值的概率情况。

上面的例子中，“事件”我们只生成了一个随机数，现假设我们生成了1000个随机数，这就是随机变量，我们想看一下它的分布，当然我们这个随机数并非完全随机，我们让它服从正态分布：
```
import numpy as np
import matplotlib.pyplot as plt

# 生成1000个服从正态分布的随机数
mu = 0
sigma = 1
data = np.random.normal(mu, sigma, 1000)

# 绘制直方图
plt.hist(data, bins=30)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Variable')
plt.show()
```

1alt

1.3 累积分布函数

累积分布函数描述了随机变量小于等于某个值的概率，比如刚才的正态分布，它小于0的分布概率是多少，可以堪称概率分布函数的积分，即上图中每个柱子累加：

import numpy as np
import matplotlib.pyplot as plt

# 生成1000个服从均匀分布的随机数
low = 0
high = 1
data = np.random.uniform(low, high, 1000)

# 计算累积分布函数
sorted_data = np.sort(data)
cdf = np.arange(1, len(sorted_data) + 1) / float(len(sorted_data))

# 绘制累积分布函数图
plt.plot(sorted_data, cdf)
plt.xlabel('Value')
plt.ylabel('Cumulative Probability')
plt.title('CDF of Random Variable')
plt.show()

2alt

2. 数理统计

2.1 平均值、标准差、方差、分位数

平均值是随机变量取值的加权平均，标准差衡量数据的离散程度，方差是标准差的平方，中位数将数据分成两部分，50%的数据小于等于中位数，50%的数据大于等于中位数，当然还有其他百分位数，只是分界线的差异。

我们可以使用的库函数很

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

大模型-AI小册文章被收录于专栏

1. AI爱好者，爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生，给实验室搬砖的uu，强烈建议你花时间学完这个，后续搬砖比较猛 4. 任何对编程感兴趣的，且愿意掌握一门技能的人

全部评论

推荐最新楼层

摸鱼学大师

复旦大学算法工程师

概统🤐

点赞回复分享

发布于 2023-07-14 15:01 上海

昨天 11:51

福建理工大学 golang

面试拷打求助

各位牛u们面对项目拷打和场景深挖都是怎么做的面了一个小厂,但很明显对方面试官是个老油条了,面对项目的逻辑的底层深挖总是支支吾吾回答不上来,各位牛u们来点建议不玻璃心,求拷打和提升

点赞评论收藏

分享

05-13 22:39

门头沟学院 Unity3D客户端

实习第一天居然发生这么多事，我怎么这么倒霉！！！

今天是实习的第一天，也是我旷的第一节课，没想到这一天这么倒霉。首先，在今天上午，正拼着ui呢，辅导员突然打电话过来，原来是今天上课的时候直接来了一个严查，辅导员直接去我宿舍，直接发现我不在学校，直接给我打电话，问我去哪里了，我肯定不能说出去实习了呀，我就说我出去玩去了，辅导员问出去玩为什么不请假，我直接说我要请两天假，于是辅导员让我周六去他办公室，，，不知道会发生什么事，反正400块钱路费是没了。其次，今天下午在拼ui的过程中发现公司这个项目的ui做的很差劲，于是在以前经常交流unity的群里吐槽了一下公司，没想到直接被老板看见了！不是哥们我怎么这么倒霉呀，还好老板没说话

点赞评论收藏

分享

04-25 09:55

长春理工大学软件测试

软件测试简历

二战寄了，然后包装了一下简历，投出去没人搭理我，问ai感觉千篇一律的车轱辘话，厚米们我这简历有什么优化的地方吗，信息不够精炼吗😇我投的7 8k岗位是要太多了吗😇😇😇麻了

不吃西蓝花：不对，BOSS上都没到看简历这一步💔💔💔

你已经投递多少份简历了

点赞评论收藏

分享

不愿透露姓名的神秘牛友

04-21 17:34

我真蠢，上班三天才知道mt让看文档啥意思

第一次实习的时候啥也不懂mentor第一天跟我说的。我说好。我以为只是第一天这样。第二天——"你先看看文档。"第三天——"你先看看文档。"第五天我鼓起勇气问："那我后面大概做什么方向？"他说："不急，先熟悉。"我点开过的文档数了数，三十多篇。每一篇我都有认真看实在无聊，我打开同学群看看大家都干啥呢。有人说他入职第一天就改了bug。有人说他mentor每天带他review代码。有人说他们组上周聚餐了。我每天的成就是：又看了五篇文档。上了一周班后，晚上我收工位走出公司，那一刻我突然明白"你先看看文档"是什么意思。不是让我熟悉。是他也不知道让我干嘛。我真的谢

文聚星：说明你这是大厂，小厂才会来了直接上手写

实习时最怕听到的一句话

点赞评论收藏

分享

05-10 20:41

蚌埠坦克学院嵌入式软件开发

做过驱动、写过协议，为什么嵌入式面试还是容易挂？

很多人对嵌入式面试有个误解：能把板子点亮，能把功能跑通，面试就稳了。其实不是。面试官筛的，从来不只是“你做过没有”。而是看你有没有：工程思维、问题定位能力、系统理解能力。很多人项目经历写得不差。做过驱动，写过协议，碰过 FreeRTOS，也调过 Linux。但一到面试，还是容易卡住。原因很简单：你会做，不代表你讲得出“为什么这么做”。1. 面试官不只听你做了什么，更听你怎么拆问题你说你做过串口驱动。面试官真正在意的不是“串口驱动”这四个字。他更想知道：波特率怎么配置中断和轮询你怎么选收发缓存怎么设计丢包问题怎么定位高并发打印为什么可能拖垮系统同样都是“做过串口”。有人只能说功能。有人能说设计、...

点赞评论收藏

分享

评论

1

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的求职总结 #

480833次浏览 6799人参与

# 投格力的你，拿到offer了吗？ #

187535次浏览 915人参与

# 27届实习投递记录 #

77269次浏览 858人参与

# 我是XXX，请攻击我最薄弱的地方 #

91802次浏览 625人参与

# 26届春招投递记录 #

12574次浏览 86人参与

# 中电科13所进度交流 #

6908次浏览 39人参与

# 风评不好的公司，你会去吗？ #

155335次浏览 706人参与

# 哪一瞬间让你觉得“这班不如不上” #

46734次浏览 279人参与

# 入职第四天，心情怎么样 #

56448次浏览 475人参与

# 拼多多工作体验 #

61857次浏览 435人参与

# 产品面经 #

297517次浏览 2217人参与

# 海信求职进展汇总 #

105820次浏览 424人参与

# 这些公司卡简历很严格 #

107483次浏览 494人参与

# 美团开奖 #

417026次浏览 1818人参与

# 字节7000实习来了，你投了吗？ #

59832次浏览 456人参与

# 总结:offer选择，我是怎么选的 #

297500次浏览 1596人参与

# AI让海力士市值突破9000亿美元 #

9384次浏览 122人参与

# 牛油的搬砖plog #

206198次浏览 1332人参与

# 小厂实习有必要去吗 #

94442次浏览 449人参与

# 正在实习的你，几点下班 #

354753次浏览 3072人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务