首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
麻薯苏苏
中国农业大学 算法工程师
关注
已关注
取消关注
M
@健身编码工作三不误:
机器学习面经
经历了2023年的秋招,现在也已经入职半年了,空闲时间将面试中可能遇到的机器学习问题整理了一下,可能答案也会有错误的,希望大家能指出!另外,不论是实习,还是校招,都祝福大家能够拿到满意的Offer!机器学习面经系列的其他部分如下所示(这是我在其他地方写的,感兴趣的同学可以点波关注捏):机器学习面经-共13章节1、机器学习模型1.1 有监督学习模型1.2 无监督学习模型 1.3 概率模型什么是监督学习?什么是非监督学习? 所有的回归算法和分类算法都属于监督学习。并且明确的给给出初始值,在训练集中有特征和标签,并且通过训练获得一个模型,在面对只有特征而没有标签的数据时,能进行预测。 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如 分类。 非监督学习:直接对输入数据集进行建模,例如强化学习、K-means 聚类、自编码、受限波尔兹曼机。 半监督学习:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数。 目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。 无监督学习里典型的例子就是聚类了。聚类的目的在于把相似的东西聚在一起,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。1.5、回归、分类、聚类的区别与联系1.6、生成模式 vs 判别模式 生成模型: 由数据学得联合概率分布函数 P(X,Y),求出条件概率分布P(Y|X)的预测模型。 朴素贝叶斯、隐马尔可夫模型、高斯混合模型、文档主题生成模型(LDA)、限制玻尔兹曼机。 判别式模型: 由数据直接学习决策函数 Y = f(X),或由条件分布概率 P(Y|X)作为预测模型。 K近邻、SVM、决策树、感知机、线性判别分析(LDA)、线性回归、传统的神经网络、逻辑斯蒂回归、boosting、条件随机场。2、线性模型2.1 线性回归 原理: 用线性函数拟合数据,用 MSE 计算损失,然后用梯度下降法(GD)找到一组使 MSE 最小的权重。 线性回归的推导如下所示:2.1.1 什么是回归?哪些模型可用于解决回归问题? 指分析因变量和自变量之间关系. 线性回归: 对异常值非常敏感 多项式回归: 如果指数选择不当,容易过拟合。 岭回归 Lasso回归 弹性网络回归2.1.2 线性回归的损失函数为什么是均方差?2.1.3 什么是线性回归?什么时候使用它? 利用最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析. 自变量与因变量呈直线关系; 因变量符合正态分布; 因变量数值之间独立; 方差是否齐性。 2.1.4 什么是梯度下降?SGD的推导? BGD: 遍历全部数据集计算一次loss函数,然后算函数对各个参数的梯度,更新梯度。 BGD、SGD、MBGD之间的区别2.1.5 什么是最小二乘法(最小平方法)? 它通过最小化误差的平方和寻找数据的最佳函数匹配。 2.1.6 常见的损失函数有哪些?0-1损失均方差损失(MSE) 平均绝对误差(MAE) 分位数损失(Quantile Loss) 分位数回归可以通过给定不同的分位点,拟合目标值的不同分位数; 实现了分别用不同的系数控制高估和低估的损失,进而实现分位数回归交叉熵损失合页损失 一种二分类损失函数,SVM的损失函数本质: Hinge Loss + L2 正则化2.1.7 有哪些评估回归模型的指标? 衡量线性回归法最好的指标: R-Squared 什么是正规方程? 正规方程组是根据最小二乘法原理得到的关于参数估计值的线性方程组。正规方程是通过求解编辑来找出使得代价函数最小的参数解出: 编辑2.1.9 梯度下降法找到的一定是下降最快的方向吗? 不一定,它只是目标函数在当前的点的切平面上下降最快的方向。 在实际执行期中,牛顿方向(考虑海森矩阵)才一般被认为是下降最快的方向,可以达到超线性的收敛速度。梯度下降类的算法的收敛速度一般是线性甚至次线性的(在某些带复杂约束的问题)。 2.1.10 MBGD需要注意什么? 如何选择m? 一般m取2的幂次方能充分利用矩阵运算操作。 一般会在每次遍历训练数据之前,先对所有的数据进行随机排序,然后在每次迭代时按照顺序挑选m个训练集数据直至遍历完所有的数据。也称为"对数几率回归"。知识点提炼 1.分类,经典的二分类算法! 2.LR的过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证这个求解的模型的好坏。 3.Logistic 回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别) 4.回归模型中,y 是一个定性变量,比如 y = 0 或 1,logistic 方法主要应用于研究某些事件发生的概率。 5.LR的本质:极大似然估计 6.LR的激活函数:Sigmoid 7.LR的代价函数:交叉熵优点: 1.速度快,适合二分类问题 2.简单易于理解,直接看到各个特征的权重 3.能容易地更新模型吸收新的数据缺点: 对数据和场景的适应能力有局限性,不如决策树算法适应性那么强。LR中最核心的概念是 Sigmoid 函数,Sigmoid函数可以看成LR的激活函数。Regression 常规步骤: 寻找h函数(即预测函数) 构造J函数(损失函数) 想办法(迭代)使得J函数最小并求得回归参数(θ)LR伪代码: 初始化线性函数参数为1 构造sigmoid函数 重复循环I次 计算数据集梯度 更新线性函数参数 确定最终的sigmoid函数 输入训练(测试)数据集 运用最终sigmoid函数求解分类的推导为什么 LR 要使用 sigmoid 函数? 1.广义模型推导所得 2.满足统计的最大熵模型 3.性质优秀,方便使用(Sigmoid函数是平滑的,而且任意阶可导,一阶二阶导数可以直接由函数值得到不用进行求导,这在实现中很实用)为什么常常要做特征组合(特征交叉)? LR模型属于线性模型,线性模型不能很好处理非线性特征,特征组合可以引入非线性特征,提升模型的表达能力。 另外,基本特征可以认为是全局建模,组合特征更加精细,是个性化建模,但对全局建模会对部分样本有偏, 对每一个样本建模又会导致数据爆炸,过拟合,所以基本特征+特征组合兼顾了全局和个性化。为什么LR比线性回归要好? LR和线性回归首先都是广义的线性回归;其次经典线性模型的优化目标函数是最小二乘,而LR则是似然函数;另外线性回归在整个实数域范围内进行预测,敏感度一致,而分类范围,需要在[0,1]。LR就是一种减小预测范围,将预测值限定为[0,1]间的一种回归模型,因而对于这类问题来说,LR的鲁棒性比线性回归的要好参数求解的优化方法?(机器学习中常用的最优化方法) 梯度下降法,随机梯度下降法,牛顿法,拟牛顿法(LBFGS,BFGS,OWLQN) 目的都是求解某个函数的极小值。工程上,怎么实现LR的并行化?有哪些并行化的工具? LR的并行化最主要的就是对目标函数梯度计算的并行化。 无损的并行化:算法天然可以并行,并行只是提高了计算的速度和解决问题的规模,但和正常执行的结果是一样的。 有损的并行化:算法本身不是天然并行的,需要对算法做一些近似来实现并行化,这样并行化之后的双方和正常执行的结果并不一致,但是相似的。 基于Batch的算法都是可以进行无损的并行化的。而基于SGD的算法都只能进行有损的并行化。如何解决低维不可分问题? 通过特征变换的方式把低维空间转换到高维空间,而在低维空间不可分的数据,到高维空间中线性可分的几率会高一些。 具体方法:核函数,如:高斯核,多项式核等等与最大熵模型MaxEnt的关系? 没有本质区别。LR是最大熵对应类别为二类时的特殊情况,也就是当LR类别扩展到多类别时,就是最大熵模型。为什么 LR 用交叉熵损失而不是平方损失(MSE)?编辑 如果使用均方差作为损失函数,求得的梯度受到sigmoid函数导数的影响;编辑求导:编辑 如果使用交叉熵作为损失函数,没有受到sigmoid函数导数的影响,且真实值与预测值差别越大,梯度越大,更新的速度也就越快。编辑求导:编辑 记忆:mse的导数里面有sigmoid函数的导数,而交叉熵导数里面没有sigmoid函数的导数,sigmoid的导数的最大值为0.25,更新数据时太慢了。能否解决非线性分类问题?可以,只要使用kernel trick(核技巧)。不过,通常使用的kernel都是隐式的,也就是找不到显式地把数据从低维映射到高维的函数,而只能计算高维空间中数据点的内积。编辑用什么来评估LR模型?1.由于LR是用来预测概率的,可以用AUC-ROC曲线以及混淆矩阵来确定其性能。2.LR中类似于校正R2 的指标是AIC。AIC是对模型系数数量惩罚模型的拟合度量。因此,更偏爱有最小的AIC的模型。如何解决多分类问题?(OvR vs OvO)编辑在训练的过程当中,如果有很多的特征高度相关或者说有一个特征重复了100遍,会造成怎样的影响? 如果在损失函数最终收敛的情况下,其实就算有很多特征高度相关也不会影响分类器的效果。但是对特征本身来说的话,假设只有一个特征,在不考虑采样的情况下,你现在将它重复100遍。训练以后完以后,数据还是这么多,但是这个特征本身重复了100遍,实质上将原来的特征分成了100份,每一个特征都是原来特征权重值的百分之一。如果在随机采样的情况下,其实训练收敛完以后,还是可以认为这100个特征和原来那一个特征扮演的效果一样,只是可能中间很多特征的值正负相消了。2.2.13 为什么在训练的过程当中将高度相关的特征去掉? 去掉高度相关的特征会让模型的可解释性更好。 可以大大提高训练的速度。如果模型当中有很多特征高度相关的话,就算损失函数本身收敛了,但实际上参数是没有收敛的,这样会拉低训练的速度。 其次是特征多了,本身就会增大训练的时间。 今日先更新到这里了,机器学习的总共为12章节,除此之外还有深度学习!等后续一序列更新~
点赞 27
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
03-23 19:32
南京信息工程大学 Java
字节跳动Tiktok后端一面凉经
面试官人非常好, 我描述不清还会做总结, 问题全来自简历, 没有为难人, 全程体验很棒, 但是寄了主要都在问项目, 中间穿插了部分八股 1. 进行自我介绍(Tiktok组, 所以要求做英文的自我介绍, 但这个不是卡点) 2. 进行项目拷打 3. 讲一讲MySQL里的事务(着重讲解MVCC的底层机制) 4. 讲一讲RocketMQ是怎么保证消息不丢失的(生产者, broker, 消费者) 5. 出了个场景题, 假设Tiktok有大量评论, 需要按顺序归档, 打包成顺序消息, 但是消费端消费不来该怎么办 6. 我项目用到了向量库, 面试官问了嘴, 怎么保证数据库和向量库数据一致性, 解决脏数据问题...
我的失利项目复盘
点赞
评论
收藏
分享
03-24 22:11
中南大学 Java
考公是对的,张老师走好!
考公是对的 熬夜加班是错的 健康生活是对的 学计算机入互联网是错的 张老师走好!一刻也没有为张老师的死哀悼,接下来赶赴战场的是:痛击每个计算机系学生的惨淡就业市场!
什么专业适合考公
点赞
评论
收藏
分享
01-30 09:45
燕山大学 Java
实习六个月就得到这个结果😃
喵_coding:
这种直接跑就完事了 哪有毕业了才签合同 任何offer和三方都没有的
点赞
评论
收藏
分享
02-22 15:15
南京大学 Java
简历求拷打
目前0实习,想找中大厂的暑期实习和日常实习,目前进度hot100快刷完了,八股看了一多半(但很多感觉忘记了)。恳求大佬们给出一些建议和指导😸
牛客31544035...:
南大加大加粗,可以海投了
点赞
评论
收藏
分享
03-23 16:58
已编辑
福州大学 Java
字节飞书后端一面面经分享
前30min自我介绍+项目经历。ps:项目经历感觉没问很深的细节,也没拷打,就看我简历的技术栈来问的(看你这边写熟练mysql,那巴拉巴拉,看你熟练http,tcp,那巴拉巴拉)。agent项目细节一个没问。项目部分问题:1.你这些是实习项目吗?(我说找的然后自己做优化)2.你这个里面为什么用Lua脚本?3.redis那个服务端,怎么保证这个原子性的?4.redis的实现架构上,比如说他的线程模型,进程模型,以及他的并发角度,来解释一下他的原子性。5.redis的持久化策略?为什么两个都用?6.我看你用了一个令牌桶+滑动窗口双算法限流,这个地方能简单描述一下调研了哪些限流方案?,或者你了解哪些...
大厂面试问八股多还是项目...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
Agent面试拷打!
2.1W
2
...
AI应用开发岗,简历怎么写才能脱颖而出?
8666
3
...
双非选手的求职的感悟
7707
4
...
阿里笔试竟然考了AI提示词。。。
6573
5
...
美团暑期实习一面
6353
6
...
面试官视角聊聊:如何避免成为“AI工具人”
6128
7
...
网申助手用了三周,说说真实感受(不是广告)
5947
8
...
快手暑期实习3.25发offer啦
5365
9
...
聊一聊一些 Agent 项目的亮点(进阶)
4561
10
...
快手后端-Java开发一面面经
4048
创作者周榜
更多
正在热议
更多
#
AI面会问哪些问题?
#
14129次浏览
282人参与
#
你做过最难的笔试是哪家公司
#
16655次浏览
109人参与
#
开放七大实习专项,百度暑期实习值得冲吗
#
8854次浏览
116人参与
#
你的实习产出是真实的还是包装的?
#
14212次浏览
209人参与
#
找AI工作可以去哪些公司?
#
3776次浏览
83人参与
#
春招至今,你的战绩如何?
#
44389次浏览
384人参与
#
米连集团26产品管培生项目
#
11923次浏览
276人参与
#
从事AI岗需要掌握哪些技术栈?
#
3964次浏览
112人参与
#
机械/制造每日一题
#
91940次浏览
1491人参与
#
阿里笔试
#
168056次浏览
1207人参与
#
春招你拿到offer了吗
#
822571次浏览
9948人参与
#
应届生进小公司有什么影响吗
#
132705次浏览
1188人参与
#
长得好看会提高面试通过率吗?
#
18137次浏览
191人参与
#
学历对求职的影响
#
656360次浏览
4205人参与
#
应届生第一份工作最好去大厂吗?
#
143274次浏览
1214人参与
#
沪漂/北漂你觉得哪个更苦?
#
6954次浏览
120人参与
#
一张图晒出你司的标语
#
2422次浏览
35人参与
#
HR最不可信的一句话是__
#
3909次浏览
75人参与
#
AI时代,哪个岗位还有“活路”
#
7866次浏览
214人参与
#
职场新人体验
#
180352次浏览
1215人参与
#
工作丧失热情的瞬间
#
374970次浏览
2574人参与
#
什么专业适合考公
#
58544次浏览
303人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务