百度 数据挖掘/机器学习 连续三面

从上午9点一路面到12点,从毫不抱希望到充满希望,反馈牛客网,求过百度!!!
一面50min--------------------
面试官是个幽默又可爱的小哥哥,面试体验感非常好
主要内容:因为我有两个项目都是NER相关的,所以主要是我介绍我的项目工作
期间面试官的一些问题:1.HMM和CRF区别?(因为我不了解HMM,就讲了CRF的原理),2.RF和GBDT,XGBOOST的区别?然后就是一个算法题:给两个字符串,可以对其中一个字符串进行增删移动添加操作求将其中一个字符串转变成另一个字符串的最小操作步骤,然后面试官直接告诉我通过,让我等下一轮
二面50min-------------------
二面面试官也是一个幽默又温和的小哥哥
首先,自我介绍之后,深挖项目,突然觉得有两个相关项目还挺好,问的时间都还挺长
然后就是一些基本问题:crf损失函数?过拟合怎么解决?正则化项有哪些,作用分别是什么?谱聚类算法实现,切图方式?哎呀,就一些基本问题,其他的脑子确实太满了,想不起来了
最后就是一个编程题:旋转矩阵二分查找(要求时间复杂度是log(n)),菜鸡的我控制不了时间复杂度,然后就让直接写普通二分
反问,然后就说让我不要离开,马上下一轮
三面40min------------------
二面完了直接连三面,水都没来得及喝一口,最后感觉说话都沙哑了
三面面试官是个比较严肃的小哥哥,但是温度 问题比较偏逻辑性
首先简单自我介绍,然后问了一些项目相关内容
然后就是一些我感觉比较偏数学的问题:模型优化方法(梯度下降?还有呢?不知道)?l1正则化和l2正则化分别加了什么先验条件?(拉普拉斯分布和正态分布),L1和L2适用于什么场景,具体怎样实现的呢?SVM损失函数怎样求解的呢,可以用梯度下降法求解吗?梯度下降法求解适合用于什么场景?过拟合的欠拟合介绍,怎样解决过拟合?
最后是一道概率+算法问题:给N个绳子,每次取两个端点打结在一起,求最终绳子打结的期望(先用数学公式描述,再用代码描述)
技术面试环节完了,面试官又问了可以入职时间以及实习时长,反问环节
面试官说最后结果会在一到两周内通知
至此,我的百度三面完成,消耗量真的太大了!!!大家面试一定要提前多吃一些!!!牛客网许愿,早日拿到百度offer!!!小伙伴们继续加油冲啊!!!

#面经##百度##数据挖掘工程师##机器学习#
全部评论
太强了
点赞 回复
分享
发布于 2021-04-10 12:52
楼主三面是不是就是指能过呀?还是还要看第三面是否给过?
点赞 回复
分享
发布于 2021-04-10 13:33
联易融
校招火热招聘中
官网直投
同,上午一口气三面,面的CV
点赞 回复
分享
发布于 2021-04-10 14:18
面完三面,许愿offer
点赞 回复
分享
发布于 2021-04-10 15:17
楼主什么时候做的百度机试啊
点赞 回复
分享
发布于 2021-04-10 15:52
暑期实习吗?我日常一面就没了😢,惨
点赞 回复
分享
发布于 2021-04-10 18:15
楼主你好,请问你是实习、校招还是社招?
点赞 回复
分享
发布于 2021-04-10 19:17
楼主这道题你做出来了吗? 最后是一道概率+算法问题:给N个绳子,每次取两个端点打结在一起,求最终绳子打结的期望(先用数学公式描述,再用代码描述)
点赞 回复
分享
发布于 2021-04-10 19:24
一看画风清新的面经就知道楼主是小姐姐!!!
点赞 回复
分享
发布于 2021-04-13 17:11
许愿
点赞 回复
分享
发布于 2021-04-14 01:04
出题这么难的吗,一面就是道hard😂
点赞 回复
分享
发布于 2021-04-16 17:03
老哥啥时候能等到oc呀
点赞 回复
分享
发布于 2021-04-17 11:38
请问题主,想请教几个问题,我是双非研究生,参加过本科大学生数模竞赛和研究生数模竞赛都是一等奖,不知道对找数据挖掘岗位或去大厂实习有没有帮助?不知道希望大不大?刚开始准备,不知道咋下手准备?能指点一二吗?谢谢 了
点赞 回复
分享
发布于 2021-12-24 11:50

相关推荐

【一面】1. word2vec的原理,skip-gram训练的具体流程,使用的损失函数,是怎么选择正负样本的,选择样本上有哪些优化算法,负采样的原理,还有哪些优化方法2. 贝叶斯调优,机器学习中有哪些优化参数的方法,为什么交叉熵会作为softmax结果的损失函数?梯度下降为什么有效,关于损失求一阶导数为什么有效?刚你提到了泰勒一阶展开,泰勒二阶展开有哪些相关的优化方法呢?3. SGD的原理,计算公式是什么,4. 在图的那个项目中担任了什么角色,做出了哪些贡献5. 介绍一下LSTM,seq2seq和transformer,介绍一下attention的原理6. Linux,bash这些有用过吗7. auc的计算方式(使用(FPR,TPR)算,排序公式去算),为什么这两种都可以计算出auc呢?它们之间有什么联系?然后就是使用sql写出auc的计算公式8. 有1000部电影,想要给人推荐,你有什么思路9. 手撕:接雨水,使用sql写auc【二面】1. cnn做bn的方式,rnn是怎么做的,bn的好处2. gpt和transformer的区别3. 机器学习中方差和偏差的理解4. bagging和boosting的区别5. 位置编码的理解,attention的理解6. transformer和rnn的区别7. lstm为什么可以缓解梯度消失8. 异构图,GCN,word2vec,fasttext,9. SGD和adam的区别,在DNN中分别适用于什么样的情形10. 用过哪些DNN模型,11. 贝叶斯在推荐中的应用12. bagging和boosting的方法有哪些13. 手撕:三数之和,柱状图中的最大矩形面积【三面】1. 会C和C++吗2. 数据结构的掌握程度3. 平常使用的技术栈有哪些4. 对推荐的了解5. 有哪些召回算法6. 对于推荐中排序的理解7. 排序算法,稳定性和时间复杂度8. 互联网每天都有很多用户搜索数据,在一天的日志中找到搜索频次最高的10个query,怎么实现(topk问题,使用堆)9. 堆排序稳定吗,时间复杂度(刚才在回答排序算法的时候,没有说到堆排序)10. 搜索的词条补全 是根据什么数据结构实现11. 现有的春招推进情况12. base地点倾向许愿许愿!!!
点赞 评论 收藏
转发
#快手# #暑期实习# #二面#  #推荐算法# #推荐算法面经# 时间2024年4月3日 15:00 总计65min1.自我介绍 2.本科推荐系统项目(参考一面面经)3.论文4. 讲一讲CTR预估和序列推荐模型- DIN DIEN SIM  Caser GRU4Rec SLiRec CLSR MIND....5. 了解矩阵分解吗- MF、LFM6.LSTM模型介绍,几个门的作用7.transformer模型结构8.自注意力机制的计算复杂度(原始qkv)- O(dn^2)9.二分类任务的损失函数,搓个交叉熵代码10.怎么理解交叉熵- 条件熵,含义可以理解为预测概率分布和真实概率分布之间的差异程度11.优化器optimizer了解吗- 开始吟唱:[BGD、miniBGD、SGD]=>SGDMAdagrad=>RMSProp=>Adam12.一阶动量和二阶动量在Adam公式中的位置13.为什么需要对神经网络进行初始化,全部初始化为相同的值会怎么样- 梯度反传相同=>网络退化14.最长上升子序列:板子题,动态规划O(n^2),动规+二分O(nlogn),时间够写了两种解法反问环节:1. 是否和一面面试官一个团队(二面再问团队规模和业务方向有点怪)2. 后续提升方向:聊了很多,感悟也很多,觉得面试官人还怪好的。(虽然本来就只打算套个评价)奇怪的是,面试官问我是没参加秋招吗,我回答说找的是暑期实习。然后面试官说他那边看着是投递的春招的岗位,所以按照这个标准来面的,那没事,我帮你操作一下,变更到暑期实习,方便推进下一步流程。我顿时亚麻呆住了,难怪八股强度这么高,优化器和网络退化都整出来了。==========感觉能过,面得酣畅淋漓,是这么多场面试发挥最好的一场了。希望有三面,我快要撑不下去了,找暑期实习属实磨人。=====更新,当天晚上就约三面了,4.9,不愧是“快”手。
点赞 评论 收藏
转发
头像
04-23 11:00
已编辑
重庆大学 计算机类
#实习##蚂蚁##算法#电话面试,光速下班。答出来的不说了。两个没答出来的。1)设计损失函数,让第一大的预测结果和第二大的预测结果差值最大化    直接回答的loss加一个-(first - second),似乎不被接受。请教了一下AI,它提出了一些可能的方法:    penalty = torch.clamp(margin - (first - second ) contrast_loss = 1 / (first - second + 1e-6) => 距离度量形式进行了改编 rank_loss = F.relu(margin-(first - second)) => 基于ReLU的设计,和1差不多        2)KMEANS聚类的时候,如果先验的已知某些结点不是一类,应该怎么做    step1:对于这个策略,我们可以手动选择聚类中心,确保已知的不应属于同一类的点(例如点A, B, C)从一开始就被分配到不同的聚类中。初始的簇中心点一定满足要求。    step2:执行KMEANS常规的聚类过程。并且检查特定点是否在同一聚类:    每次迭代后,查看点A、B、C的聚类标签。如果发现任何两个(或三个)点属于同一个聚类,那么进入下一步。    step3:重新分配点到其他聚类:为了重新分配,首先计算这些点到所有其他聚类中心的距离。选择一个距离第二近的聚类中心(或根据具体情况选择最合适的),将其中一个或多个点分配到该聚类。    step4:更新聚类中心:在调整了聚类分配后,重新计算所有聚类的中心,以最小化整体的代价函数。这通常意味着要重新计算每个聚类中所有点的平均位置作为新的聚类中心。    重复迭代:step234:继续执行K-means迭代,直到满足收敛条件,即聚类中心的变动非常小或达到预设的迭代次数。沉默太久了,真的折磨,不是我能去的公司,太菜。现在回想,其实也不是太难的问题。可能是太紧张了吧。放平心态继续前行
点赞 评论 收藏
转发
4 52 评论
分享
牛客网
牛客企业服务