微软STCA NLP Group实习面经

记录一下微软STCA NLP Group的实习面经,是发paper的纯研究岗,无论是岗位性质、研究方向,还是企业氛围、工作环境都是自己一直非常向往的

一面:
  • 自我介绍
  • 聊简历的项目
  • 算法题
二面
  • 给导师讲(更多是讨论)提前发来的两篇paper,都是和组内做的东西相关的
  • 聊自己发的paper
  • 简单说下简历上其他的经历
总体来讲体验非常好,也非常顺利,因为各方面确实比较匹配。导师非常非常nice,hr的效率也很高。已经拿到offer啦~
#微软实习##实习##面经##微软##自然语言处理##算法工程师#
全部评论
本科就发paper了,也太强了吧
2 回复
分享
发布于 2021-03-09 14:44
请问有cv 或ml组嘛?是在苏州还是北京?
1 回复
分享
发布于 2021-02-11 11:57
联想
校招火热招聘中
官网直投
大佬是哪一届毕业的呀?
点赞 回复
分享
发布于 2021-02-08 17:31
洗牌是什么算法?
点赞 回复
分享
发布于 2021-02-09 15:18
大佬在哪投的简历啊?为啥我投了就石沉大海了呢😂
点赞 回复
分享
发布于 2021-03-07 10:53
请问只有两面吗?
点赞 回复
分享
发布于 2021-03-12 17:17
大佬方便问一下你投的哪个组吗😅
点赞 回复
分享
发布于 2021-03-12 20:59
恭喜恭喜~
点赞 回复
分享
发布于 2021-03-26 09:41
请问你已经去实习了吗?我这边也在考虑,想问一下相关情况
点赞 回复
分享
发布于 2021-04-21 12:11
要入职了,打听下stca nlp group组内节奏如何,听说挺累(⊙o⊙)…
点赞 回复
分享
发布于 2021-06-04 17:06
也想请问工作强度和是属于哪个大group下的
点赞 回复
分享
发布于 2021-06-23 17:13

相关推荐

这次面的是工程院 bing 团队的 LLM 应用组,问的问题量不大,有一些比较开放性的问题比较有意思。1.自我介绍 两面都有2. 主要会根据项目做一些介绍,这个一面久,二面短一些。3. 一面问了 transformer 结构4. 有没有做过大模型之外的 NLP 相关的内容(简单讲了讲)二面的开放性问题5. 做 rag 应用的时候, 如果幻觉问题严重怎么办?比如已经给了很多 rag 召回的内容了,但是还是错误很多,尤其是一些时间数字类的信息,很容易不准确。(我回答:类似于指令微调,构造对应的数据集, 微调强化大模型对检索的内容的跟随能力)6.接着上面,那你觉得这种数据集怎么构造呢? 检索的内容和问题很好弄,但是答案怎么获取方便?(我: 我觉得可以反向构造,我先从网络上爬一堆内容作为答案,比如把新闻里的一些信息作为答案,然后让大模型比如 gpt4 生成对应的问题, 再检索召回相关的内容,构造数据集。 面试官说这个想法还挺有意思的)7. 我想通过加噪声的方式提高模型的鲁棒性, 你觉得这个噪声应该怎么加好? 或者说怎么确定加在 token 的什么位置,加什么 token?(不太懂,我就说从我一般的理解,加噪声都是从 embedding 去加的, 比如随机加一些高斯噪声提高鲁棒性)8.如果我做 rag 召回的相关内容里,会有人恶意注入了一些错误的信息, 你觉得会影响大模型的生成内容吗?怎么避免?(我认为肯定会有影响, 因为关注的信息有错。 我觉得可以提高召回的信息量, 从而稀释错误信息占比来解决)9.接着上面的回答, 我们的输入长度有限制,不能无限加召回的内容怎么办?(可以在检索召回链路中再加一层,类似于粗排后再精排一次,从而减少错误信息的量)其他的不记得了,就是感觉现在面试很喜欢问一些开放性问题。代码题一面编辑距离, 二面是一个有序数组左边平移一定位置后的数组,找到一个 target 的下标。都不算难。
点赞 评论 收藏
转发
xdm第一次见三个面试官一起面的场景1.自我介绍2.做两道算法题(昨天刚好做过这两道,乐)一道翻转链表,一道strstr()3.HTTP了解吗?介绍一下HTTP1.01.12.0的区别。介绍一下HTTP三个组成部分,解决跨域在哪个?4.会python吗?介绍一下你常用的库,介绍一下装饰器5.TCP报文格式了解吗?介绍一下TCP在timewait状态下接受syn应该怎么做6.go的gc了解吗,Java的呢,python的呢(没学过Java)7.介绍一下虚拟内存?为什么要有虚拟内存,32位最多虚拟内存为多少?8.你知道Linux的内存淘汰算法吗?说一下实现的大致思路9.MySQL了解吗?介绍一下加锁规则?见过死锁吗?怎么引起的?怎么解决?10.redis了解吗?了解主从复制吗?了解哨兵集群吗?了解切片模式吗?11.redis在你的项目中干嘛的?假如有一个文章突然特别热,造成大KEY你应该怎么做?12.缓存击穿,缓存雪崩,缓存穿透,以及解决方案13.了解过计算机视觉吗?(听说过)14.sql语句,求新用户半个月内的登录次数(模了半天搞出来了)15.剩下的基本都是项目相关了,不过问的也是比较浅,并没有详细问16.你了解过唯一索引和普通索引加锁规则的区别吗?这两个使用有什么区别?一般用哪个?为什么?changebuffer下一步在哪?pagecache还是磁盘?(我还在想这怎么可能在磁盘)17.你确定你们学校允许你现在出来实习?(其实我是不确定的)反问:技术栈?c++go这个挺想去的,明天去试探一下导员的,考试再跑回来
点赞 评论 收藏
转发
14 23 评论
分享
牛客网
牛客企业服务