百度机器学习算法春招一二三面面经

【一面】
1. word2vec的原理,skip-gram训练的具体流程,使用的损失函数,是怎么选择正负样本的,选择样本上有哪些优化算法,负采样的原理,还有哪些优化方法
2. 贝叶斯调优,机器学习中有哪些优化参数的方法,为什么交叉熵会作为softmax结果的损失函数?梯度下降为什么有效,关于损失求一阶导数为什么有效?刚你提到了泰勒一阶展开,泰勒二阶展开有哪些相关的优化方法呢?
3. SGD的原理,计算公式是什么,
4. 在图的那个项目中担任了什么角色,做出了哪些贡献
5. 介绍一下LSTM,seq2seq和transformer,介绍一下attention的原理
6. Linux,bash这些有用过吗
7. auc的计算方式(使用(FPR,TPR)算,排序公式去算),为什么这两种都可以计算出auc呢?它们之间有什么联系?然后就是使用sql写出auc的计算公式
8. 有1000部电影,想要给人推荐,你有什么思路
9. 手撕:接雨水,使用sql写auc
【二面】
1. cnn做bn的方式,rnn是怎么做的,bn的好处
2. gpt和transformer的区别
3. 机器学习中方差和偏差的理解
4. bagging和boosting的区别
5. 位置编码的理解,attention的理解
6. transformer和rnn的区别
7. lstm为什么可以缓解梯度消失
8. 异构图,GCN,word2vec,fasttext,
9. SGD和adam的区别,在DNN中分别适用于什么样的情形
10. 用过哪些DNN模型,
11. 贝叶斯在推荐中的应用
12. bagging和boosting的方法有哪些
13. 手撕:三数之和,柱状图中的最大矩形面积
【三面】
1. 会C和C++吗
2. 数据结构的掌握程度
3. 平常使用的技术栈有哪些
4. 对推荐的了解
5. 有哪些召回算法
6. 对于推荐中排序的理解
7. 排序算法,稳定性和时间复杂度
8. 互联网每天都有很多用户搜索数据,在一天的日志中找到搜索频次最高的10个query,怎么实现(topk问题,使用堆)
9. 堆排序稳定吗,时间复杂度(刚才在回答排序算法的时候,没有说到堆排序)
10. 搜索的词条补全 是根据什么数据结构实现
11. 现有的春招推进情况
12. base地点倾向
许愿许愿!!!
全部评论
要答上来多少才能过呀
点赞 回复 分享
发布于 2024-04-20 00:16 广东
👏👏👏
点赞 回复 分享
发布于 2024-04-10 12:29 美国
佬面的是什么部门呀
点赞 回复 分享
发布于 2024-04-10 10:07 广东
佬什么时候面试的呀
点赞 回复 分享
发布于 2024-04-10 00:14 湖北
没想到还在考这些古老的技术啊
点赞 回复 分享
发布于 2024-04-09 22:16 北京

相关推荐

04-08 15:10
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.这个方案有没有考虑过在单 Agent 里面继续丰富它的 tool?3.单 Agent 和多 Agent 这两条路线,你们当时是怎么考虑的?为什么最后选择了多 Agent?4.如果模型自己思考并自主选择调用什么工具、执行什么操作,这种方式有什么问题?5.Agent 可以自主决定要不要调用工具;如果不需要就结束整个 ReAct 循环。那按这个逻辑,理论上是不是不需要额外做 Agent 编排/流程设计?6.刚刚提到的那个基于业务知识库的RAG系统,你们是怎么搭建的?7.召回是基于向量相似度做的吗?还是基于 embedding 模型,或者别的方式?8.我听到这里的 TopK,是不是一个向量检索相关的概念?因为你刚刚提到了向量数据库,是吗?9.在这个项目里,你觉得自己做得比较好,或者最有挑战的一件事是什么?10.刚刚提到这个场景涉及多 Agent 的综合调用,是吗?11.如果是在同一个业务领域里,为什么不考虑做成单 Agent,让模型自主思考后再去调用?12.既然 Tool 背后本质上就是 RPC 接口,那不能统一封装后交给同一个 Agent 内部去调度吗?13.你们这个检索/召回方案里,评价指标具体怎么看?14.你们拆成多 Agent 之后,链路失败或局部失败时怎么处理?15.多 Agent 场景下,上下文传递为什么要用 json / slot 这类结构化方式?16.如果 Tool 本身都能统一封装,为什么还要按业务拆 Agent?17.你在线上项目里是怎么权衡响应时间和效果的?手撕:单词拆分
查看17道真题和解析
点赞 评论 收藏
分享
查看16道真题和解析
点赞 评论 收藏
分享
05-04 11:25
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目里你遇到最大的难点是什么?怎么解决的?3.rag针对模糊提问精准检索:如何识别用户问题模糊度?完整处理流程?4.关键词检索存在关键词漂移问题,如何平衡向量匹配 & 关键词匹配?5.混合检索 RRF 加权参数 K,你是怎么调的?业务上有没有自定义调整?6.向量检索更准时,K 值应该调大还是调小?7.查空教室 + 推荐火锅,多轮推理、任务调度是怎么做的?8.前序 Agent 编造假教室(幻觉),直接执行下一步火锅推荐,幻觉链式积累怎么处理?9.如果检测 Agent 自身也幻觉、误判,工程上怎么解决?如何保证检测 Agent 可靠?10.项目基于 GPT5.4,有没有真实用户大规模上线使用?11.简历写测试服务耗时缩短 40%,是线上数据还是个人自测?12.ToC 上线有没有考虑敏感词、违规内容安全过滤?13.开发过程有没有使用 AI 辅助开发(vibe coding)?完整工作流程是什么?14.AI 长任务开发出现上下文丢失、忘记需求、乱改代码,如何优化解决?15.本科学习中你认为最重要的基础技能是什么?为此做了哪些努力?16.HTTP1.1、HTTP2、HTTP3 协议核心区别精华是什么?17.HTTP3 性能更好,为什么内网微服务依然多用 HTTP2?HTTP2 内网优势是什么?18.V8 引擎垃圾回收机制是什么?19.MySQL 索引原理是什么?B + 树结构?20.向量检索引擎算法 IVF、HNSW 核心区别是什么?21.Java 接口和抽象类的区别?22.Java8 接口支持 default 默认方法后,抽象类还有存在意义吗?接口无法替代抽象类的点是什么?23.ai coding 编写一个函数
查看22道真题和解析
点赞 评论 收藏
分享
评论
7
53
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务