首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
-北天-
江苏海洋大学 Python
发布于湖北
关注
已关注
取消关注
@子虚乌有先生:
日常实习面经:滴滴-数据科学
TimeLine:一面20211109当时的BG:北邮本硕,管理类专业,一段实习经历:美团商业分析师写在前面的话:该文档记录日常实习面试的相关问题,面试时间为2021年。以下问题的答案可能存在错误,敬请读者批评指正一面1. 数据库种类有哪些?分别举例说明一下?1)关系型数据库:Oracle,Microsoft SQL Server,MySQL2)非关系型数据库:HBase2. 简要介绍一下Hive先介绍Hadoop,Hadoop是一整套大数据生态系统,主要包括:1)HDFS:海量数据的存储2)MapReduce:海量数据的分析和计算3)Yarn:资源管理和作业调度其中,MapReduce本质上是一类分布式计算框架,底层由Java写成,在实现海量数据的分析和计算上具有一定的开发难度,Hive应运而生。Hive是基于Hadoop的数据仓库工具,可以将结构化的数据文件映射成一张类似关系型数据库的数据表,提供了类似SQL(通常称其为HQL)的查询功能,简言之,Hive是一个将SQL任务转换为MR任务的工具3. SQL中的join有几种?4. SQL中如何实现分组排序?row_number() over(partition by ... order by ...)rank() over(partition by ... order by ...)dense_rank() over(partition by ... order by ...)5. SQL考察数据表:用户表user_profile,字段有:user_id '用户id',login_date 登陆时间'找出连续登录时间最长的用户with a as(select user_id, login_date,row_number() over(partition by user_id order by login_date ASC) as rnfrom user_profile),with b as(select user_id, date_sub(login_date, rn) as login_startfrom a),with c as(select user_id, login_start, count(login_start)as continuous_daysfrom bgroup by user_id, login_start)select user_idfrom cgroup by user_idhaving continuous_days = max(continuous_days)6. 缺失值处理的方式?1)缺失比例过高直接舍弃2)均值/众数/中位数填充3)插值法填充(e.g.牛顿插值法)4)机器学习算法填充(以想要填充的列为label,其他数据列为features)7. 离散化特征转为连续性特征的方法?1)顺序型特征有先后顺序,直接作数值变换2)名义型特征没先后顺序,作one-hot或dummy变换8. 数据集不均衡的解决方法?1)采用ROC曲线下AUC作为分类判定标准,该指标不会受到样本集分布不均衡的影响2)过采样和欠采样(基于数据的方法)过采样,即增加少数类样本集的样本量,如SMOTE算法、Tomek Links算法等欠采样,即减少多数类样本集的样本量,如Easy Ensemble算法、NearMiss算法等3)调整正负样本的权重惩罚(基于算法的方法)改变模型训练时的目标函数,对少数类样本分类赋高权重,多数类样本分类赋低权重4)转化为单类学习、异常检测(基于算法的方法)注:从第9题开始,其后问题的答案均可在《百面机器学习》这本书中得到,十分推荐大家阅读一下这本书9. 是否了解集成学习?简要介绍一下思想?注:回答围绕bagging和boosting即可,并举例说明1)bagging:随机森林RF2)boosting:GBDT/XGBOOST/LightGBM10. 偏差和方差的概念?和bagging、boosting有什么关系?1)偏差bias:模型输出值与真实结果的偏离程度,boosting能有效改善这一点2)方差variance:模型输出值与模型输出值均值的平方差,bagging能有效改善这一点此处有追问:为什么bagging能够改善方差?boosting能够改善偏差?针对“为什么bagging能够改善方差?”bagging是对样本集做重采样,对重采样后的样本集训练模型,对多个模型的输出取平均。由于重采样后子样本集的相似性,所以各模型具有相似的偏差和方差,因此不会显著降低偏差。下面详细讲解bagging 能改善方差的原因:假设各模型间相互独立,则有若各模型完全相同,则有bagging方法得到的各模型间是有相关性的,因此模型输出均值的方差区间为针对“boosting能够改善偏差?”boosting本质上是前向加法模型,从优化角度来看,就是不断通过迭代的方式最小化损失函数其偏差自然是下降的。但这种sequential、adptive的策略使得模型之间的相关性很强,所以boosting本质上不会降低方差
点赞 18
评论 1
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-28 11:33
亚马逊_校园招聘经理
【亚马逊 | 软件开发工程师】0~2年工作经验(23届+24届+25届)
SDE北京 - 24届应届毕业生 及 具备2年以内工作经验的候选人(23届),都可以投递本职位。· 毕业时间:放宽到2023年1月 - 2025年6月之间毕业的应届毕业生(例如23年毕业之后 如已经工作,工作经验在0-2年均可投递)· 工作地点:北京· 软件开发工程师, (New graduate or Entry-level Engineer) https://amazon.jobs/en/jobs/2858086/new-graduate-or-entry-level-engineer-0-2-years如需内推,发送邮件+简历到cn-sp-sde@amazon.com,邮件主题:SDE ...
点赞
评论
收藏
分享
07-30 13:44
门头沟学院 Java
影石面试
听说hc很少
点赞
评论
收藏
分享
07-10 04:50
广东科技学院 单片机
大佬们能帮我看看这份简历有什么问题吗?
大四刚毕业出来找工作,投了有一个星期,发现HR很多都是已读不回😂
点赞
评论
收藏
分享
07-07 16:32
门头沟学院 Java
简历怎么脱颖而出
先说明一下本人目前状况,学院本,27,无实习经历,算法很差打过比赛但是都没有理想的成绩,项目学成在线和点评,下图是我简历,从六月到现在海投了1700份,简历才投出40份,我现在有个疑虑点是没有出色的竞赛经历,没有过硬的本科背景,想靠着实习经历来弥补一下简历,但是现在一个实习都找不到啊,甚至面试都约不到啊,这要怎么搞,是我的问题吗,我java技术栈基本都通了,现在是不要那么焦虑再沉淀换两个高质项目等大三再找会不会好点,现在以目前状况每天投根本没有响应啊
Lorn的意义:
1.学院本海投都是几千份起步的,继续边准备边投,不要灰心 2.你这简历给我的第一眼就是有些杂乱,很可能是面试官看着不顺眼直接给你pass了,下面这张就很顺眼 3.其他优化点就是可以让AI帮你帮项目每一条描述包装高大尚一点 越早越好投,不要松懈,越往后可能性越小,加油
查看图片
点赞
评论
收藏
分享
07-31 14:12
门头沟学院 Java
究竟是什么样的工作能给hr逼成这样
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
百度提前批,三面被推迟一周,喜提秋招第一凉
7614
2
...
虾皮秋招一面
3255
3
...
百度提前批 三面
2800
4
...
他拿大厂SSP Offer打牌是什么概念啊?25届双非之光
2728
5
...
小鹏offer
1559
6
...
被猿辅导挂了简历,但我想说...
1442
7
...
虾皮一面凉经
1375
8
...
最强本科✌
1347
9
...
上班一周,工资还没拿,先欠公司两千
1296
10
...
大学四年,我感觉我像个“孤勇者”
1236
创作者周榜
更多
正在热议
更多
#
简历上的经历如何包装
#
29601次浏览
821人参与
#
秋招被确诊为……
#
164165次浏览
752人参与
#
中兴秋招
#
205779次浏览
2296人参与
#
工作中哪个瞬间让你想离职
#
63717次浏览
569人参与
#
你最希望上岸的公司是?
#
135227次浏览
706人参与
#
和同事相处最忌讳的是__
#
24493次浏览
244人参与
#
25届网易互娱暑实进度
#
78430次浏览
702人参与
#
虾皮求职进展汇总
#
249475次浏览
1856人参与
#
投格力的你,拿到offer了吗?
#
86798次浏览
583人参与
#
2022毕业即失业取暖地
#
102716次浏览
662人参与
#
2022毕业生求职现身说法
#
89298次浏览
700人参与
#
秋招OC许愿
#
327823次浏览
2450人参与
#
你最近一次加班是什么时候?
#
71006次浏览
350人参与
#
26届的你,投了哪些公司?
#
45379次浏览
497人参与
#
你的秋招第一面感觉怎么样
#
76936次浏览
592人参与
#
柠檬微趣工作体验
#
6746次浏览
40人参与
#
你遇到最难的面试题目是_
#
16705次浏览
201人参与
#
我对___祛魅了
#
48626次浏览
441人参与
#
地平线求职进展汇总
#
52660次浏览
370人参与
#
研究所VS国企,该如何选
#
194855次浏览
1819人参与
#
如果校招重来我最想改变的是
#
271937次浏览
2853人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务