渣渣春招实习数据挖掘,数据分析,算法岗面经

渣渣春招实习数据挖掘,数据分析,算法岗面经

腾讯:数据分析,被推到微信部门,一面挂
1、异常数据处理(假设年龄和性别缺失,应该怎么处理)
2、独立和不相关的区别
3、T分布
4、几种距离度量公式
5、knn原理,如何做回归,如何做多分类
6、k-means,如何选取最佳k值
7、spark数据倾斜
8、mapreduce对数据实现从大到小排序
9、给你一个比较急的项目,如何安排,如何规划直至如期完成?(考验抗压能力)
海康,算法岗,一面挂
1、数据挖掘的流程,你最熟悉那个流程(我选的特征工程)
2、算法层面讲一下为什么用LabelEncoder编码之后比较好
3、一个离散属性,有三个类别,离散之后训练,这时候如果来个测试集,新来了3个类别,如何做?
4、xgboost如何防止过拟合?如何输出概率?算法上怎么输出概率的?
5、海量数据寻找Topk
6、sql语句,子查询,具体忘了
7、xgboost gblinear和gbtree的区别
8、xgboost min_child_weight为什么可以防止过拟合?
9、特征选择分为几种,优缺点
10、特征有几种编码方式?优缺点
11、特征选择选出来的特征是全局最优解吗?为什么?
12、样本不平衡对什么评价指标不影响?为什么
13、模型上线了解吗?
小米:总共三面,数据挖掘岗(已发offer)
一面:
1、hdfs和别的数据库的区别,hdfs的特点
2、mapreduce详细原理
3、Hivesql内置函数
4、xgboost欠拟合如何解决?
5、拉格朗日因子的作用
6、svm的损失函数(让我说公式)
7、讲一下项目,创新点
8、java后台有没有了解?
9、写过spark没有?spark原理
10、ID3,c4.5,cart的区别
二面:经理面,简历,项目
没有问原理性的东西,都是问一下项目流程,从中学到了什么等等问题。
三面:
1、链表逆置
2、scala写代码
地平线:数据挖掘,二面(等通知)
一面:mr手写topk,项目流程,为什么这么做等等问题
二面:继续怼项目,两个sql问题,链表去重,折半查找原理

简历投了好多,由于是菜鸡,所以给面试机会的公司寥寥无几,目前阿里还在等电话,华为4月9号现场面

#阿里巴巴##腾讯##小米##华为##数据挖掘##实习##算法工程师#
全部评论
老哥,xgboost的几个题目如何回答的呀?望赐教。
点赞 回复 分享
发布于 2019-05-20 21:38
一个离散属性,有三个类别,离散之后训练,这时候如果来个测试集,新来了3个类别,如何做? 这个怎么回答呀
点赞 回复 分享
发布于 2019-04-18 13:20
海康的问法一模一样啊,让你选个流程中熟悉的部分,然后问相关的,完全不问我简历上的项目。
点赞 回复 分享
发布于 2019-04-10 15:05
想问楼主的项目是学校的,还是网上的呀?
点赞 回复 分享
发布于 2019-04-10 10:51
想问lz做过哪些项目
点赞 回复 分享
发布于 2019-04-07 15:27
咱们海康估计一个面试官哈哈,楼主是职位显示已淘汰?
点赞 回复 分享
发布于 2019-04-07 15:16
lz感觉学校对面试影响大吗
点赞 回复 分享
发布于 2019-04-07 13:02
为什么用LabelEncoder会更好 楼主你是怎么回答的 是因为维数更少么
点赞 回复 分享
发布于 2019-04-07 11:45
同问海康第三题
点赞 回复 分享
发布于 2019-04-07 11:19
海康第三个咋答呀,老哥知道吗😂
点赞 回复 分享
发布于 2019-04-07 10:58
楼主什么时候面的海康  多久给的结果?
点赞 回复 分享
发布于 2019-04-07 00:08
小米是实习嘛,居然就这么开始了
点赞 回复 分享
发布于 2019-04-06 21:33
感谢分享,可以问一下楼主做的什么项目吗
点赞 回复 分享
发布于 2019-04-06 21:32

相关推荐

头像
03-03 13:17
已编辑
苏州大学 Java
面试官真的很有耐心,人非常nice,但问得也是真的很细。面完半小后约HR面。有没有人说说HR面会问啥?【希望能过吧,以前真没想到面个试这么耗精力,这一周感觉都被掏空了】1.请做一下自我介绍。2.你掌握的数据结构有哪些?3.请讲一下一致性哈希的原理和解决的问题。4.请讲一下Ring buffer(环形缓冲区)的相关内容。5.请讲解一下HTTP状态码的相关分类和含义(如2xx、3xx、4xx、5xx)。6.请讲解一下四层网络负载均衡和七层网络负载均衡的区别,以及各自的应用场景。7.请讲一下反向代理的原理和常用工具,以及正向代理的相关内容。8.进程间通信的方式有哪些?哪种方式效率更高,为什么?9.请讲一下MySQL主从复制的实现原理(基于binlog、redolog相关)。10.多个从节点之间出现数据不一致的问题该如何解决?11.你了解的消息中间件有哪些?RabbitMQ、RocketMQ、Kafka这三种消息中间件的区别是什么?12.Redis中最常用的数据结构有哪些?13.请讲一下Redis中Zset(sorted set)的底层实现和优化策略。14.什么是小哈希和大哈希,二者在查找、插入性能上有什么区别?15.请讲一下TCC分布式事务算法的相关内容,以及它和2PC、3PC的区别。16.你在项目中使用的服务发现组件是什么,它的实现原理是什么?17.你在项目中使用的序列化协议是什么,为什么选择该协议?18.长连接的适用场景是什么?哪些场景不适合使用长连接,原因是什么?19.请设计一个评论系统(包括数据库表设计、数据结构、关联关系等)。20.【反问】想具体知道会做哪些模块的工作?有没有导师?
百特曼3:节子还是一如既往的八股大厂
查看78道真题和解析
点赞 评论 收藏
分享
评论
17
238
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务