offer还愿 社招面经 数据科学+算法

牛客网真的灵灵灵,写下面经回馈社区!有的实在是太久远了,只记得自己不太会/印象点深的问题了,请大家见谅。
本人背景:美国本硕数学统计专业,一年半美国传统机器学习工作经验,半年国内互联网大厂。没怎么刷题,所以后来主要找了数据科学的职位,算法真是面得我和面试官都心累

360反作弊算法:

项目经历

xgboost特征设计, 算法介绍

Kmeans簇中心不再变了的含义,K如何选择,如何iterate

算法题给一有序数组,按绝对值排序


微博机器学习反作弊算法:

项目经历:特征设计,召回率不足的情况

SVM描述

算法题三数之和、快排


快手数科:

一面

项目经历,AUROC含义,项目用户留存率漏斗

XGBoostGBDT区别

sql题计频次、合并三店销量,row_numberrank区别

二面

单词级逆序,要求空间复杂度O[1]

辛普森悖论、如何修正(加权)

三面

数据不均衡解决方法:过采样,创造样本,负样本加权
项目经历,简历上每个项目的细节、如何实现都问到了,有一个项目不经常说,结果有点磕巴
kmeans流程、调试
实验设计
开放题:如何衡量一个时间序列/一个分布的混乱度,他们之间如何进行比较,如何描述多个时间序列/分布的混乱度

腾讯数科一面:

AUC物理含义

outlier怎么判断 怎么处理

缺省值怎么处理

Categorical variable训练集只出现4种,测试集出现新的第五种,怎么办?

归一化,统一做还是训练集测试集分开做?

xgboost调参 样本特征比

p值,power,一型二型错误,置信区间,t-test

python求平均数 sql求回复的回复数


字节数据科学职位:

一面:

职位、项目介绍

xgboost数据不均衡如何处理

gbdtrandom forest区别

算法最短路径、数组找出相邻三数之和最大的

二面(后来知道是交叉面,我感觉这大哥除了算法啥也不懂):

DFS:
【在微服务的架构下,公司内部会有非常多的独立服务。

服务之间可以相互调用,往往大型应用调用链条很长,如果出现循环依赖将出现非常恶劣的影响。

对于一个具体应用,已知各个服务的调用关系(即依赖关系),请判断是否存在循环调用。

输入:

一组服务依赖关系list,('A', 'B') 表示 A 会调用 B 服务

service_relations = [('A', 'B'), ('A', 'C'), ('B', 'D'), ('D', 'A')]

输出:

由于存在 A - B - D - A 故存在循环依赖,返回True;反之如果不存在,返回False

Follow up

1. 如果有多个环,请都检测出来

2. 返回每个环中的服务名】

sql求每日留存

one-hot外其他的embedding

数据降维方法

字节广告审核数据分析:
一面不记得具体问啥了,项目、xgb算法等等反正聊得挺好的,二面上来算法题两道树结构 一道从n个数里选第k大的,我写了个排序nlog(n),问还有更快的吗,不给提示,我说我想想,然后直接就“今天的面试就到这”
其实就是上面那个数科岗位算法题挂了,我才又投递了这个数分岗位,我就想问,宇宙条的数据分析岗也要考算法吗?我怀疑这个组不想招人,就只想知道其他公司怎么做的,随便找个理由把我拒了?从此对头条印象一落千丈

阿里数科一面:

特征工程
不考虑准确率的情况下,如何提高覆盖率?
smote原理,如何操作,如何决定最近的n
聊下来发现确实不太匹配。。

最后接了快手offer,面下来最大的一个体会就是 适合自己的才是最好的!就我自己举例,原来觉得算法高大上,但没有cs背景没怎么刷题,确实和别人比没那么有优势;相反统计和数学背景,特征工程的工作经历,使得我在更贴近商业/业务时sense会更好一些,所以可能也是一个认识自己的过程吧。。

总之祝大家求职顺利,都拿到自己想要的offer!
#面经##社招##腾讯##字节跳动##快手##阿里巴巴#
全部评论
大佬tql!欢迎大佬参加我们的社招面经征集活动呀!有京东卡可以拿~社招面经征集|参加过社招的牛友,来发面经吧,拿京东卡~:https://www.nowcoder.com/discuss/374207 #社招面经#
点赞 回复 分享
发布于 2020-07-29 18:22

相关推荐

海尔提前批的测评是真能给人整自闭4.16投的简历 5.21收到的测评(据说提前批还卡学历的) 测评包括四个部分,一个是心理测评,很常规。第二个是综合测评,涵盖工作场景应对、逻辑推断、信息获取、语句排序、数学计算、数学逻辑推断等,数学计算有些题目要花点时间思考,有些题目甚至不是算的是猜的,跟北森的相比难度偏大一些。第三个测评是笔试部分,做过难度最大的评测,总体难度跟华为的差不多了选择题20题还好,以流体力学为主,偶有传热学、工程热力学的知识,基本也都是概念相关,建议好好复习概念;简答题一道工程热力学在生活场景应用题,两道燃烧理论及应用的题目,还有一道英文题,这个没复习过我全凭印象写的;最搞的是居然还有一道计算题!!MD,这谁还能记得随便套了几个公式,定理,写了一下数据,最后咋样就管不了了,我尽力了 最后一个是AI英语面试,这个是最坑爹的,每个英语回答10秒钟时间准备四分钟时间回答,前几个问答也就算了,后面直接给你考听力,题目都还没看完就播完了,没有任何体验 一套做下来觉得自己信心备受打击,而且这些测评强度都很大,从发测评到提交也只给了3天时间,正好撞上老板一直给安排事考完都有点不自信了,希望后面的招聘别是这么地狱的难度
点赞 评论 收藏
分享
评论
8
88
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务