网易杭研-数据挖掘,二面挂

一面:
1. 本科毕业后还工作过两个月?是工作还是实习?
2. 看你简历上写了大部分大数据相关的,不是专搞数据挖掘的,为什么投数据挖掘,有没有投大数据的岗位?
3. 我对大数据框架这些不是很懂,就问数据挖掘的问题吧,先说说项目二吧,大致说了下,自己做了数据提取跟数据分析的工作,没有涉及机器学习算法
4. 主动给他说另外项目一中数据挖掘的部分,他提到不平衡数据的问题,嗯问到点上了,说了下自己在这方面做的工作以及新的想法(借鉴目标检测领域focal loss的思想应用到Adaboost的权重更新策略中),说了一大堆,表示很满意
5. 你对什么算法比较熟或者有什么自己的想法,答曰SVM(面试前一直在手推SVM)
6. 说说你对SVM的理解,不要说书上的,说说别人不知道的或者你自己的想法,大概介绍了下,还是书上那点内容,书上怎么说我也怎么理解
7. 想了下该问点啥,一般模型都是一个经验误差项加上一个正则化项,同样的目标,SVM跟其它的模型如LR训练得到的结果为什么不一样?(大概是这个意思),答曰SVM的对偶问题转换成了对阿尔法系数的优化,而其它的是直接对w进行优化,应该是他想要的答案,他说是这样的,自己又补充了一下。
8. 你自己还有其它什么想说的,有什么想法?
9. 说了一个他自己的问题,大概是支持向量到超平面的距离为什么可以从a/w转换成1/w而没有影响,就是怎么确定哪一个是支持向量或需要多少个支持向量的问题,我没太理解,他说没关系,这是也我自己的疑惑,反正我这边不会卡你,就等着下一面吧。。。


二面:
1. 先自我介绍一下吧
2. 看你简历上写的大数据相关的工作,如果可以是否愿意调剂到大数据岗位?
3. 说说项目一,怎样一个数据流程?
4. 为什么要用Spark Streaming来处理数据,大概说了下项目数据量大,实时性要求较高的问题,没太明白他到底想要问的是什么,又问做了spark streaming做了哪些数据处理操作,优化数据合并操作具体做了哪些,大概说了下减少数据shuffle的处理,后来又回到了为什么要用spark Streaming的问题,感觉他也没有理解我说的
5. hbase跟其它key/value存储有什么区别?hbase为什么要用列簇,有什么好处,这块没答上来
6. spark跟hadoop有什么区别?
7. 说说项目二,做了哪些工作,提取了哪些特征,不同的用户推荐的视频资源不一样这个该怎么处理,说到推荐系统的问题,不了解,给自己挖了个坑。。。这个项目只做了简单的数据提取跟分析工作
8. 如何提取有用的特征,怎样才知道这个特征是有效的,不能一个个去试吧?这个不太好说,结合项目一大概说了下根据应用领域的专家经验人工提取能有助于预测的特征,还有用深度学习方法自动提取,感觉并没有说出他想要的答案
9. 如何选取合适的数据挖掘算法,不能一个个去试吧?这个也不知道咋说,笼统的说了下,感觉也没有达到点子上,欢迎大佬们指点
10. 说说你对自己的一个定位,今后想从事的方向,大数据工程还是数据挖掘。感觉两方面都答得不好,妥妥地跪了
#网易#
全部评论
hr面呢
点赞 回复
分享
发布于 2017-09-02 12:39
😂
点赞 回复
分享
发布于 2017-09-02 12:42
联想
校招火热招聘中
官网直投
感觉一面面试官和我同一个,数挖五组
点赞 回复
分享
发布于 2017-09-02 12:46
比我强多了,我都不知道面试官是什么方向的,说了想干后台,结果他是干算法的,完全没戏了
点赞 回复
分享
发布于 2017-09-02 14:36
一面树蛙七组,二面树蛙二组,二组的面试官问了我不到二十分钟,蜻蜓点水,然后挂了,都没什么面经
点赞 回复
分享
发布于 2017-09-02 16:32
请问下是杭研-互联网产品的数据挖掘岗吗
点赞 回复
分享
发布于 2017-09-02 20:06
*****科大出来不都是军官了吗为什么还要去网易
点赞 回复
分享
发布于 2017-09-02 20:13

相关推荐

点赞 60 评论
分享
牛客网
牛客企业服务