拓竹科技 机器学习算法 一面面经

整体70分钟,人麻了

1.自我介绍

2.介绍实习内容,我介绍了一下我在网易做智能npc相关的,他说他之前也在网易伏羲工作然后他开始问我业务背景,问我训模型调了什么参数、测评怎么做的、数据怎么优化的,问得很细

3.介绍第一个项目,我的是一个rag的项目,我先整体介绍了一下,他开始问问题,问我数据构建,向量库构建,用的什么数据库存储的,召回怎么做的,然后问我对比解码的原理,问我对rag做优化的话有什么思路

4.问我有没有论文,我寻思我三篇不是在简历上写着吗我就说有,他问我这是不是水文,看着像水文,我说也不算太水吧,感觉这嗑唠不下去了呀他说他们当时发的都是cikm,kdd和www,我说我发这也是B类的,和cikm等级差不多,然后就和他讨论了一会科研相关的,他说现在大模型出来对传统研究冲击比较大,我说确实,说了一下我的见解

5.手撕代码,一道最大的n个元素,这个题我没看题解,我之前做过一个第k个最大元素的,用快速选择做的,然后我以为这个跟那个有关联,就用快速选择改着做,结果面试官不让,他说了一个他的方法让用他的做,我没听懂然后僵持了半天,有点坐牢

6.反问,我问部门主要做什么的,他说主要做3d打印社区相关的,里面涉及给用户推荐,用户问答啥的;我问他问答用的模型是自己训还是怎么的,他说是调api自己训成本高

总的来说时间也有点太长了,坐牢属于是

——————————————

更新,两天后约了二面

#找实习多的是你不知道的事#   #实习,投递多份简历没人回复怎么办#  #实习中的菜狗时刻#  #24届软开秋招面试经验大赏#  #牛客创作赏金赛#
全部评论
佬是离职了吗,面试强度这么大
2 回复 分享
发布于 2024-08-05 23:00 广东
好多面试
1 回复 分享
发布于 2024-08-14 23:07 黑龙江

相关推荐

📍面试公司:地平线🕐面试时间:9.26💻面试岗位:嵌软❓面试问题:1.项目拷打(20min),系统思考、原理分析等2.系统安全考虑,芯片加密存储key等的校验方式,密钥存储到启动校验3.用户侧core原理和调试和内核panic原理4.GPS底层驱动遇到的问题排查,DMA驱动适配,串口使用DMA会出现的问题,排查手段,GPS解析出现问题的排查手段5.V4L2框架,用户侧实现流程,相机驱动移植,USB/MIPI移植用的哪些工作,pipeline6.I2C开发可能出现的问题,硬件驱动排查原理,I2C基础知识掌握(地址7和10位使用场景,总线仲裁原理等)7.图像像素占用大小,YUV422和444区别,为什么使用YUV4228.用户态和内核态的通信方式,通信不是切换9.驱动中poll、中断、异步机制的实现原理,详细讲解poll、select、epoll再内核层面的实现原理10.驱动加载实现用户接口的原理,netlink机制到UDEV实现的过程,和传统的设备加载机制的区别11.内核实现调度的机制(主动和被动的场景),被动触发的机制(触发和执行的流程,实际举一个其中的定时器中断实现调度的全流程),多核调度均衡的原理,CFS的原理,使用了preempt_rt的调度优先级在用户到内核统一同一个数轴的详细原理12.还有好多场景问题,想不起来了13.反问🙌面试感想:面试总时长1小时30分钟,地平线考查的很深,面试时间也很长,还有好多场景题目,对于知识的理解和问题的排查更为关注,也有一两个没有回答上,面试官也主动解答,面试体验很好,等待通知
发面经攒人品
点赞 评论 收藏
分享
09-22 14:41
已编辑
门头沟学院 算法工程师
面试是24年7月的现在已经入职几个月了,补一下面经,帮有需要的同学参考。BG:本硕985 计算机论文1A1B一面:技术面自我介绍 & 简历相关。简单介绍了自己在多模态和大模型方向的研究/工作经历,包括在校期间的论文工作以及实习经历。面试官主要针对简历上的项目提了一些细节问题,比如具体模型的量级,提升了多少,和哪些方法做了比较等。因为是自己的工作,所以没有卡壳。问有没有遇到过 Python 文件之间互相 import 的问题,出现这种问题怎么办?让我简单介绍了一下 PPO 算法,以及和 TRPO 的区别是什么?接着 PPO,问了一下 ChatGPT 的 RLHF 流程,以及为什么不直接用 SFT,而是要用强化这么麻烦的方式训练模型?继续追问 RLHF、SFT、LoRA 的区别,分别适用于什么场景?反问:公司现有业务是什么,计算资源情况等。二面:主管面论文介绍。让我用通俗的语言介绍我自己发表和投稿的论文,重点是研究动机和要解决的问题。问有没有亲手训练过大模型,最多用了多少张 GPU 卡?并行训练使用的框架是什么?介绍一下 DeepSpeed,说一下这个框架在并行的不同阶段(ZeRO stage)分别做了哪些事?训练模型的时候,数据量有多少,怎么收集数据的,训练花了多少时间?遇到的最大问题是什么?问在大模型全量微调时,显存消耗分别由哪些部分占用?(参数、梯度、优化器状态、激活信息等),分别占用多少?假设模型参数量为N,请分不同情况讨论和计算一下微调所需要的显存(不同精度、batch size、seq len 等)。说一下 LoRA 公式,讲一讲其中 A 和 B 两个矩阵分别表示什么。LoRA 的优缺点是什么,什么场景下适合使用?问知道哪些大模型训练和推理框架,用过哪些?问 LLaVA 的结构是什么,和常规的纯文本大模型有什么区别?Encoder-Decoder 结构的模型转 ONNX 的一般流程,遇到不支持的算子怎么办?可能遇到的问题(动态 shape、模型中逻辑判断需要单独写、模块拆分等)。三面:HR 面主要问了为什么选择公司,对团队的看法,对岗位的认识;未来大致的规划,面试过程的体验,有没有别的公司的 offer 等。以及询问了期望薪资等。之后就是等待,最终和期望薪资基本一致。总体感受面试流程比较顺畅,问题也比较贴合岗位要求;如果和岗位匹配度高,一般流程推进速度会很快。入职以后,工作内容和面试被问的问题也差不多,基本上都是算法工程师需要做的内容,团队氛围也很不错。只是毕竟是企业,不可能光搞研究,在承接业务时还是免不了和很多人打交道和来回battle需求,这个无可避免。
查看19道真题和解析
点赞 评论 收藏
分享
评论
4
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务