网易互娱-n星计划-AI研究工程师面经

ailab,base 广州,做游戏npc,代码生成等业务
9.19 一面
1、项目相关
2、llama用的什么注意力?
3、flashattention简单讲一下?
4、ppl是什么?
5、如何选取训练后的模型?
6、有试过将多个模型权重合并吗?
7、训练时loss暴增可能是什么原因,怎么解决
8、有哪些节省显存的方式?
=======================
9.25 二面
1、项目相关
2、介绍一下SFT,lora,reward model,DPO
3、SFT只计算回答部分的损失合适吗?
4、模型蒸馏了解吗?损失是什么?可以用KL散度吗
5、交叉熵和KL散度的公式是什么
6、MQA,GQA是什么,deepseek的MLA了解了吗
7、如何训练一个代码检索模型?
8、reranker的训练目标?训练目标和我们希望的目标是否有不一致的地方,就比如训练时q-d对的匹配概率,但我们希望是检索的文档对大模型有用,这两个目标是否存在不一致呢?
========================
10.17 三面
全程问项目
========================
10.23 hr面
========================
无意向,目前还在泡池子
=================
首页第一条帖子招大模型应用算法实习生,欢迎投递
全部评论
差不多同时间hr面,还没结果
点赞 回复 分享
发布于 2024-12-12 19:37 北京

相关推荐

头像
06-28 16:18
已编辑
北京体育大学 测试工程师
面试官周末在外边玩呢,然后约我一边玩,一边儿面试。基本上就是先对我英语能力做了一个考察,然后他做了一下部门的相关的介绍,以及对候选人能力的要求,基本上需要有一定的测试思维,然后沟通能力,然后就是要有开发能力,因为需求迭代的比较快要跟开发一起联动配合做一些自动化的实现,就是有一个相关的需求,能够实现相关的自动化用例需要的能力就是Python和JAVA,可能有一部分的c,c#。一开始是英文做了些介绍,说了1min,然后就是对我自动化能力的了解,然后组里边的一些自动化框架,然后接口自动化的了解,对Python能力的了解。这块儿就是又问了一些数据结构的相关的问题,贪心和动态规划的区别,比如说广度优先遍历和深度优先遍历的区别,然后出了一个场景题,如果我有一个是8byte的字符串,然后有4000个这样的字符串,那么你的bfs,队列要到多长?然后还有就是Python和c#的相关的结合,你可能要用什么样的方法?再就是问我对天津的看法,想不想来?我说之前我在京东的时候还想去天津的京东科技呢。然后面了面人家没要我。然后最后我反问。他是从0~1搭建自动化框架,还是你去完善自动化框架,然后他说正在招一个测试的leader去进行架构设计,然后找几个骨干的自动化测试工程师去实现相关的需求。你最主要的就是开发能力,要可以把一个相关的需求实现到自动化的场景这样子基本的能力要有。目前团队有10个人这样子,但是自动化测试工程师相对来说会少一些,所以说需求的基本上是自动化测试的工程师。然后我再问,可没可能涉及到一些大模型评测,然后一些大模型的微调之类的相关的工作。他说这块儿我们team里也有专门的算法评测团队,这块儿如果你想做的话也可以和他们一起去做,但是微调在现在的阶段是没有的。然后我又问了一下,还有技术面吗?他说如果通过了的话,有我的boss,我的领导再给你面一轮技术面完了再就是HR面一共30分钟面试公司:联想岗位:software QA engineer问题:如上
查看9道真题和解析
点赞 评论 收藏
分享
评论
3
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务