算法工程师(地平线/商汤/美团/华为) 面经精华帖

在牛客网很久了,非常感谢牛客网这个平台给我的帮助,很多朋友的笔经面经非常有用,这段时间学习到了很多,以下是我自己的面试经历,希望能给接下来还有算法面试的以及未来的算法工程师们一些参考:

本人是算法方向
因为之前在滴滴实习,感觉自己可能不是那么适合做大数据相关的工作,还是想做一些跟自己比较相关的研究性的工作,只投了美团,华为以及一些创业公司,face++应该是把简历筛掉了,没消息,其他的:地平线是计算机视觉算法,美团是机器学习与数据挖掘算法,华为就不说了(进去也不知道是啥岗位),三个应该都是sp,美团价钱还没谈,但应该会去地平线了。后续国庆节后还有一个商汤科技的面试,面面看看再说吧。
  • 华为(sp offer
    • 媒体算法工程师
    • 两面(2017.8.15) :都是介绍自己论文+项目+实习+聊人生聊工资
  • 地平线机器人(sp offer)
    • 算法工程师(计算机视觉)

    • 一面:40min

    • 一面内容:

      • 滴滴实习经历,引申到随机森林和gbdt,比较下区别,问了下应用时的特点
      • 问论文,详细介绍论文的思路和方法,优越性
      • 问项目,详细介绍项目的组成和分配,以及负责的主要内容
      • 物体检测:RCNN series的介绍; 图像/视频分割的方法介绍:传统方法加深度学习方法
      • 深度学习平台的使用,有没有进行过caffe的二次开发
      • 基础的机器学习方法:聚类; LR和SVM区别
    • 二面:30min

      • 讨论论文细节和项目细节
      • 卷积有什么用?分析一下分类、检测、分割需要的特征有什么区别?用在人脸检测上的卷积和图像识别的卷积有什么区别?
      • caffe内部的卷积怎么实现
      • faster rcnn的代码细节:如何去掉生成的多余的框框?如何将anchor得到的图映射回去?如何训练faster rcnn?
    • 三面:20min

      • 自我介绍加详细解释下最拿手的论文
    • hr面:10min
  • 美团点评
    • 机器学习/数据挖掘算法工程师

    • 一面:60min

    • 一面内容:

      • 自我介绍 讲一下论文和项目
      • 讨论实习的东西 怎么样提的特征 做了哪些特征工程
      • 讲一下决策树 随机森林 随机森林的分裂节点的策略(两个随机);bagging和boosting的联系和区别; boosting中的adaboost的基本原理; boost中的gbdt的原理 和随机森林有什么区别 哪个精度更高 为什么
      • 特征工程有哪些方法(数据处理上的) 主要是统计意义上的一些操作 这块不足 需要补充 (1.OneHotEncoding 2.标准化 3.归一化 4.连续特征离散化 5.L1正则 6.GBDT 特征组合 7.特征重要性分析方法 卡方检验 8.FM 实现离散特征embeding)
      • 数据不平衡问题的解决办法(从数据角度 正采样和负采样 从损失函数角度 添加scale平衡数据 从评价角度 用ROC AUC而不用PRC) 解释ROC PRC 推导公司
      • l1正则化和l2正则化 解释 推导 联系和区别
      • 基础的机器学习的方法 lr 推导loss函数 推导sgd的参数更新结果 lr和svm的区别
      • 手写快排加上跟他讲解
    • 二面 40min

      • 自我介绍
      • 手写二叉树的层序遍历 循环实现和递归实现
      • 随机森林的原理 bagging和boosting的联系和区别 adaboost跟随机森林的区别
      • 对美团有什么建议 对在上海工作怎么看 各种聊人生聊理想
    • 三面 2017.9.14 15min

      • 自我介绍
      • 解释AUC
      • 聊人生聊理想
    • hr面 2017.9.14 15min

      • 期望薪资等
  • 商汤科技
    • 研究员
    • 一面 2017.10.23 55min

      • 自我介绍
      • 介绍论文、项目细节,问的非常细
      • 个人对CV的一些看法
      • 算法题,二分查找
    • 二面 2017.10.23 45min
      • 跟一面差不多,几乎一样地介绍了自己的论文细节
      • 算法题,两个链表的第一个公共节点
    • 终面 2017.11.1 15min  xiaogang老师面的 紧张
      • 介绍了下自己的一篇论文就完事了
    • hr面 2017.11.1 15min 主要询问手中offer情况
对于未来的算法工程师们,我想说的是:
(1)如果打算做计算机视觉方向,投创业公司的话,很多经典论文的细节一定要清楚,网络结构这些尽可能多地去掌握。
(2)如果打算做机器学习方向,对于大厂来说,美团面试中一面的那些关于特征工程的问题肯定会问,毕竟很多公司的业务上都需要特征工程。
(3)算法题不用刷太多,我剑指offer都没刷完,大多数公司算法的岗位算法题不会多难的,当然有时间多刷刷肯定好。
(4)能内推一定要内推,笔试很坑的;内推一定要趁早,晚了估计机会都没有(本人阿里投的比较晚结果简历都没过)
(5)常见机器学习方法一定要会推导,多推推理解更深刻。

最后,我之前也发过滴滴算法的实习生面经,感兴趣的也可以参考。
谢谢牛客网,谢谢牛客网上的朋友们~ 大家都会有一个好的归宿,加油!!!
#算法工程师#
全部评论
我现在是百度和地平线在纠结,大佬有什么建议吗,都是计算机视觉岗,
1 回复 分享
发布于 2019-10-24 13:51
学长,想做视觉的话这么努力呢,目前比较目迷茫,希望能得到帮助
1 回复 分享
发布于 2019-10-23 14:18
膜拜
1 回复 分享
发布于 2017-09-30 14:05
大佬决定去哪里了吗
1 回复 分享
发布于 2017-09-30 12:59
大佬最后去哪了呀
点赞 回复 分享
发布于 2020-12-18 13:41
为什么感觉问你的算法题这么简单,到底用不用刷leetcode 啊
点赞 回复 分享
发布于 2019-10-23 16:54
大佬能给个”分析一下分类、检测、分割需要的特征有什么区别”的答案吗
点赞 回复 分享
发布于 2018-10-10 14:34
求问大佬的研究生生涯是怎样的,大概通过哪些途径学习的计算机视觉相关知识和能力
点赞 回复 分享
发布于 2018-09-12 16:14
能内推一定要内推,笔试很坑的;内推一定要趁早,晚了估计机会都没有(本人阿里投的比较晚结果简历都没过)
点赞 回复 分享
发布于 2017-12-29 21:49
。。。有些观点不敢认同:刷题感觉还是要多刷啊,可能因为楼主是大佬,学校好,经历好
点赞 回复 分享
发布于 2017-12-23 09:43
大佬最后去哪了
点赞 回复 分享
发布于 2017-11-05 21:56
学长,目前研二,研一基本就是在走弯路,想找算法岗,c++,python都还算可以,理论一般般,实践的话基本也就自己捣鼓,学长帮忙看下,我这种情况是不是恶补知识,做到对基础的ML算法的推导理论熟悉,然后刷体,然后参加诸如天池这样的竞赛就差不多了,还有什么地方要努力的吗,真心求教
点赞 回复 分享
发布于 2017-10-20 14:25
大佬说的特征工程指什么?推荐算法这一类的吗
点赞 回复 分享
发布于 2017-10-20 13:28
翻了七八页,捞起来了。精华帖
点赞 回复 分享
发布于 2017-10-05 22:33
大佬…面完地平线,HR说三面面试官觉得做的太浅,他们还在纠结😂
点赞 回复 分享
发布于 2017-10-05 01:04
看来大佬一定不是霍建华
点赞 回复 分享
发布于 2017-10-04 11:49
boost中的gbdt的原理 和随机森林有什么区别 哪个精度更高 为什么   gbdt和rf 哪个精度高 求大佬解释
点赞 回复 分享
发布于 2017-09-30 13:07
感谢大佬分享!祝大佬工作顺利!
点赞 回复 分享
发布于 2017-09-30 12:44
膜拜大佬
点赞 回复 分享
发布于 2017-09-30 12:41
同计算机视觉,膜拜大佬
点赞 回复 分享
发布于 2017-09-30 12:26

相关推荐

04-30 08:04
东南大学 C++
一、基本情况 / 项目概述1.你先做个自我介绍。2.你最近的一份项目,能不能从整体框架、实现方式、你承担的角色这几个方面讲一下?________________________________________二、字节实习:端上特征平台 / 数据处理链路3.你们这个特征平台,本质上是在做哪些事情?4.你们是只做数据处理和平台化支撑,真正的使用方是各个业务侧,对吗?5.端上数据的产生流程是怎么设计的?6.特征是怎么从原始事件中生成出来的?7.不同特征之间是怎么区分的?8.数据产生之后,准确性校验是怎么做的?9.如果你们主要只是做订阅、采集、落库,那这个平台真正的复杂度和难点在哪里?10.你刚才提到的平台能力里,除了基础入库,还有哪些额外的处理或运行能力?________________________________________三、SQL 优化 / 性能问题11.你做的 SQL 优化具体是怎么发现问题的?12.这个问题最初是怎么产生的?13.你的优化方案具体分成了哪几步?14.为什么这些 SQL 可以做模板化和合并处理?15.最终修复效果怎么样?优化指标大概是多少?________________________________________四、自动化测试 / MCP / Agent 能力16.你提到做了自动化测试相关的 Agent 和 MCP,这块整体设计思路是什么?17.这个自动化测试能力具体包含哪些功能?18.你是怎么把 MCP 接进自动化测试流程里的?19.这个自动化测试后面是怎么和业务流程、版本流程结合起来的?20.如果有新增接口或者代码变更,你们后续怎么补自动化测试用例?________________________________________五、AI 投资分析系统 / Multi-Agent 设计21.你做的 AI 投资项目,是一个 Multi-Agent 项目,对吗?22.这个 Multi-Agent 架构整体是怎么设计的?23.主控 Agent 和子 Agent 之间是怎么分工的?24.不同 Agent 之间的数据是怎么流转的?25.任务列表、完成标记、工具调用列表这套机制是怎么设计的?26.你的系统提示词一般是怎么设计出来的?27.你自己先写提示词,和让 AI 帮你结构化整理,这两部分分别怎么配合?________________________________________六、Prompt / 幻觉控制28.写提示词的时候,怎么尽量减少幻觉?29.你觉得减少幻觉最关键的设计点是什么?30.除了提示词约束和标注信息来源,你还有没有别的方法控制幻觉?________________________________________七、字节中的 Agent 实践31.在字节实习期间,除了测试那块,你还做过其他 Agent 相关开发吗?32.你说的测试 Agent,本质上到底用了哪些 Agent 能力?________________________________________八、通用 Agent 设计方法论33.如果现在让你从一个业务场景出发设计一个 Agent,整个流程你会拆成哪些步骤?34.在架构设计阶段,你会先判断哪些关键问题?35.什么时候适合做简单的一问一答式 Agent,什么时候适合做 ReAct / Plan-and-Execute 这种复杂 Agent?36.长短期记忆、工具设计、安全审查,这些部分在 Agent 设计里分别怎么考虑?37.你觉得一个 Agent 的最小可行版本(MVP)应该包含哪些核心部分?________________________________________九、Agent 评估 / 数据集 / 上线38.一个 Agent 做出来之后,你怎么评估它的效果?39.你刚才说需要准备测试数据集,那这个测试集应该怎么设计?40.如果测试集不好准备,那上线前你怎么确认这个 Agent 足够可用?41.除了离线测试,你会怎么做人工测试和灰度验证?________________________________________十、Agent 安全 / Prompt Injection / 越权42.Agent 测试时,除了正常测试,你有没有了解过异常测试场景?43.你对越权调用、Prompt 投毒这类安全问题了解多少?44.如果要做这类安全防御,你会怎么设计技术方案?45.在输入侧做规则引擎和小模型审查,这两种思路你怎么理解?________________________________________十一、C++ 并发 / 异步 / 落库46.你提到过 concurrent hashmap,你能讲讲它的实现原理吗?47.这个结构是怎么保证线程安全的?48.你们当时这个并发 map 真的是无锁实现吗?49.如果是锁 + 条件变量,它具体是怎么工作的?50.你提到异步落库,这个异步队列是怎么设计的?51.你们怎么处理消息延迟、消息丢失、消息堆积这些问题?52.如果队列在内存里堆积,进程或者机器异常退出,消息怎么恢复?53.你们当时对失败重试和上报之外,有没有更完整的恢复设计?________________________________________十二、网络基础 / HTTP54.你大致说一下 HTTP/1.1 和 HTTP/2 的区别。55.在长连接场景下,比如 Agent、模型交互、AI Coding 这些场景里,HTTP/1.1 和 HTTP/2 一般分别适用于什么情况?56.如果要选协议,你会怎么考虑它们各自的适用场景?
点赞 评论 收藏
分享
评论
46
420
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务