甜甜墩

2021-10-14 23:46 算法工程师

关注

字节AI LAB NLP算法实习生二面凉+被捞后二面通过面经

来还愿啦！！之前许愿的时候说过了就立马来分享面经！于是写到快十二点分享最后拿到offerd的快乐！！大家有问题的话可以直接评论，我知道的都会回的！！

AI Lab NLP实习生

一面：能感觉到面试官是个水平贼高的人对machine learning那些推导、基础概率模型也有很深的理解，所以问我的东西也有点深，（我菜是原罪

问我的NLP项目，为什么没有用纯bert，有做过其他模型的实验吗

你觉得你的项目创新点在哪里

project里面有一个编译器项目介绍一下

编译器如何把一段c语言代码转成汇编语言？需要经历哪些步骤，有哪些中间文件？

传统的machine learning的算法了解哪些？你选择一个详细介绍一下（这里面试官说假设他是一个没有接触过这个算法的人如何讲解这个算法感觉很考察对算法的宏观理解能力）

svm相比于LR或者Perceptron 优势在哪里

详细说下svm的每一步函数优化目标最后变成什么形式在什么条件下为什么要用对偶问题（这里就是问SVM的理论推导过程了）

bert的架构是什么目标是什么输入包括了什么三个embedding输入是怎么综合的（每个词的表示是三个embedding相加的和）

bert中MLM任务的具体策略是什么（这里我了解到的是先以15%的几率选择一个词，然后80%的几率将这个词mask掉，10%换成另一个词，10%的几率不变）

transformer里面每一层的主要构成有哪些（multihead-self attention+layer normalization+forward）

Seq2seq模型中decode和encode的差别有哪些（decoder的self- attention是加了mask的，另外decoder除了attention自己的context 还要attention encoder的context）

算法题

leetcode.121. 买卖股票的最佳时机

二面

还是先问项目

BiDAF（项目里提过的模型）怎么进行word embedding的

在进行word embedding的时候如果遇到一个没见过的单词怎么处理 out of vocabulary的情况（答了直接置0然后跟随训练）这样做会有很多误差，如何进行改进？ Character embedding

了解BPE吗

Word2vec的两种训练目标是什么其中skip-gram训练的loss function是什么

bert的mask策略（一面也问到了）

bert有什么可以改进的地方（这里面试官希望能从bert的后续模型比如roberta albert等去说）

L1正则和L2正则说一下 L1满足什么分布

了解bert之后的大规模预训练模型吗

算法题

1.求数组中所有子数组和的最大值 leetcode 剑指 Offer 42. 连续子数组的最大和

2.编辑距离 leetcode 72. 编辑距离

感觉一面答得还挺差的结果过了然后二面答得比一面好点但还是挂了

其实现在回顾的话感觉自己有些东西答得确实不太行有些知道的东西也说的云里雾里的挂了也有是怪自己吧然后半个多小时以后HR就打电话来说挂了然后问我想不想参加AI lab语音组 nlp实习生岗位的面试约了面试时间（从挂了到被捞只有一秒钟）

语音组一面

一面面试官说应该是我以后的mentor 人超级好是唯一一个会先自己自我介绍的面试官然后感觉面试大部分时间都是他在介绍业务啥的反而我没回答多少问题哈哈哈哈

你觉得自己对模型的的更改能力怎么样比如在模型中增加一些层去处理其他特征

手写过CNN代码吗

用什么框架多？Pytorch/tensorflow掌握的怎么样

比如bert的position embedding要加一些其他的运算方式能否用pytorch定位然后写出来？

近期可以入职吗？有转正意愿吗？

算法题：给定一个正整数n，拆成至少两个数的和=n，让这些数的乘积最大

开放性问题在一个文本翻译的项目中你能预测到什么困难预计能用什么方式解决

感觉这次面试很奇怪问了好多你会不会xxx的问题然后并不继续问下去考察我到底会不会似乎只想知道我自己觉得自己会不会

二面

项目是QA相关的项目，面试官问了对非结构化文本信息做了哪些预处理，目的是什么

大型预训练模型除了bert以外还知道哪些？

GPT和bert间主要的区别在哪双向transformer会带来什么样的好处你知道GPT为什么不用双向模型吗 bert作为双向模型如何解决未来文本的信息泄漏问题

生成式模型了解吗和判别式模型有什么区别

哪些网络结构可以作为生成式模型的结构（transformer，所有具有encoder-decoder结构的模型都可以做生成式模型）

生成序列的时候需要用的自回归结构有了解吗（前一个时间的输出当作后一个时间的输入）

怎么去判断生成的截止点？比如给定中文生成英文，什么时候知道模型应该停止了呢（预测每一个word是截止字符的概率取概率最大的）

接下来是机器学习八股：

CNN结构pooling的作用是什么

过拟合产生的原因有哪些解决方法有哪些

常用正则化方式 L1L2正则化的区别在哪里应该如何选择他们

平时变成用什么框架和语言多一些对pytorch和tensorflow的掌握程度怎么样

算法题（感觉面试官在放水）

合并两个有序数组结果存入其中一个数组中（已经开好空间）从末尾元素开始双指针
最长递增子序列 o(n^2)做法 o(nlogn)做法

一面二面是连着的然后一天后通知过了约了第二天hr面

hr面：

你之前做过前端的实习，为什么会想转nlp算法？

你之前两次面试都是二面没通过（还面过一个c++开发岗）这次通过了你觉得是什么原因？

手上还有什么offer？和字节比更倾向哪个？

课程压力怎么样？平时花费在课程上的时间一周大概有多少？

可以实习多久？会不会有什么因素导致你中途想退出呢？

hr面完后第二天就给offer啦！！感谢字节给机会！！牛客许愿果然很灵！

#字节面试##算法工程师##面经##字节跳动##实习#

全部评论

推荐最新楼层

牛客922323826号

数据分析师

请问一般都希望多久可以入职呢？三个月后会太早面试吗😊

1 回复

发布于 2021-10-15 13:12

luciferbobo

深度学习

楼主oc了吗，hr面后到意向评估一般都半天能完成，oc会等好长时间

点赞回复

发布于 2021-10-15 14:00

联想

校招火热招聘中

官网直投

Knight2019ak

web前端

楼主这个是本科还是硕士？还有有没有学习路线分享下，谢谢了

点赞回复

发布于 2021-10-25 12:39

滴滴未来精英内推

滴滴_算法工程师

你好新手求问算法八股指的什么呢？能否指个路？感谢前辈～

点赞回复

发布于 2021-10-27 11:11

babyyang525

自然语言处理

我现在是大四正在做毕设，想明年2-5月份去字节实习，问问楼主大概什么时间开始准备好哇？以及内推到底是怎么回事，网上好多内推码呀~

点赞回复

发布于 2021-11-25 16:41

牛客487608766号

哈尔滨工业大学（深圳）自动化类

楼主的学校什么水平啊

点赞回复

发布于 2021-12-03 16:56

大胆的考拉在考古

四川大学计算机类

请问代码题用python写还是c++写好些呢，面试官会有偏向吗？

点赞回复

发布于 2021-12-06 21:31

一片花海

机器学习

楼主想问一下您，想找明年的暑期实习的话，一般什么时候开始投简历，有同学说是春节之后可以开始投了

点赞回复

发布于 2021-12-07 13:19

babyyang525

自然语言处理

楼主，面试写代码是视频会议，然后分享屏幕你自己写，一边写对方一边看这种吗？

点赞回复

发布于 2021-12-27 19:04

牛客830599216号

算法工程师

算法是letcode上的吗？

点赞回复

发布于 2022-03-29 22:20

WindJerry

04-16 21:56

字节跳动_商业化部门_保安&保洁实习生(实习员工)

懂车帝后端一二面（已hr）

字节懂车帝一面操作系统根据什么判断cpu的利用率为什么不直接基于ip通信，要有udp（ip确定网络，udp确定了进程）mac的地址是否唯一堆排序了解吗fork子进程具体流程，要很具体，父进程挂了怎么办，子进程何去何从linux文件管理系统怎么实现的进程几种状态以及怎么流转tcp累计应答机制超时重传和快重传mysql怎么保证事物的一致性，两阶段提交roaringbitmap数据结构，交并补具体过程项目中的几种数据模型，表如何设计sql：找到薪水第n的id算法：实现pow()快速幂最小栈二面直接敲题最小栈链表倒数第k个节点sql：所有科目都超过80的学生语文成绩大于数学成绩的学生平均成绩大于60的...

点赞评论收藏

陌上莫殇_

03-09 21:10

已编辑

西南大学计算机类

想找实习好难鸭

想找实习好难鸭有没有大佬能帮我康康简历鸭，每次投简历都没有一点波澜，秋招会不会毕业就失业啊，好焦虑能不能再给我提一点学习方面的意见，还有哪些需要学啊 #实习，投递多份简历没人回复怎么办#

点赞评论收藏

04-12 14:10

主要考察了嵌入式系统基础知识、C/C++编程能力、微控制器和单片机、通信协议和总线接口。先问了我介绍项目的概况，负责的部分、用到的技术、遇到的困难以及解决方法。++i和i++的区别，我解释了前缀递增和后缀递增的区别。Static关键字的作用，我说了在函数内部、全局范围内和类内部使用Static的不同情况。指针和引用的区别，定义形式、内存地址、空值、可变性、空间占用和函数参数传递等方面的区别。最后问了拷贝构造函数为什么要用引用，

CVTE一面12人在聊通信硬件人笔面经互助

点赞评论收藏

19 101 评论

招聘动态

博乐游戏

24届春招&25届实习生招聘

联想

24届应届+25届实习

24届春招硬件高薪职位集合

阅文集团2024春季校招

全站热榜

正在热议

# 都在说24和25届，谁来管21-23届呢 #

# 选了这个offer，你有没有后悔？ #