2024-04-05 17:16 Nanyang Technological University 自然语言处理

关注

腾讯NLP二面部分面经

面后隔了几天，只能按回忆大概写点，腾讯的八股和手撕都挺反套路的，考验理解

部分问题：

模型训练时，如果batch内的文本的长度大小不一，tokenize时以都最大长度padding会增加计算成本，如何解决？（不太确定，回答的先对文本按长度做排序，分好batch和max_seq_length，再混合不同max_seq_length的batch进行训练）

经过padding之后的文本输入，生推理时如何从原始文本最后一个位置开始预测？/ 如何获取最后一个位置的隐层？（没答上来，left-padding和right-padding的区别？使用input里的attention_mask?）

词表很大时，如何优化隐层到输出的Softmax层的计算量？（没答上来，word2vec里提出的hierachical softmax、负采样？）

手撕：（先出了1，不会做换了道简单些的2）

1. 使用torch的基本方法实现一个简单的RNN，输入X, Y两段文本(token_ids)，得到最后一个隐层作为表征，并计算余弦距离

2. 逐行读取一个文本文件，统计词典并按词频降序输出前k个词，排序部分写归并排序。进一步问如果文件大小超出内存该怎么读？

全部评论

推荐最新楼层

悠哉的咸鱼

深圳信息职业技术学院算法工程师

大佬二面过了吗

点赞回复分享

发布于 2024-04-06 00:52 广东

10-17 12:25

江南大学算法工程师

虾皮 shopee NLP/知识图谱方向一面面经

📍面试公司：虾皮 shopee🕐面试时间：2025.10.17 11:00💻面试岗位：算法工程师 NLP/知识图谱方向 ❓面试问题：（简历投的很早了，写的很乱，首先自我介绍，面试官要求突出介绍擅长的框架）（漫长的问项目环节。以下内容都是简历里写到过的，面试官全程基本上没有问简历内容以外的八股）为什么用USC方法？是多个不同的大模型，还是同样的模型输出不同的内容?说说SFT具体怎么做的。DPO的数据集如何构建？DPO的原理？讲讲LoRA的原理？DPO和LoRA的数据集结构有没有什么区别？（手撕代码）找最长的回文子串长度：二维dpT T被python的拷贝坑了，初始化二维数组切记不要用 dp...

查看9道真题和解析

点赞评论收藏

分享

10-10 17:43

美团_本地核心商业_前端(准入职员工)

腾讯，阿里面试

没面经，没心力写了。腾讯复活赛又要三面了，上次三面挂心里难受。淘天第三次一面又要挂了，不知道是不是拿我刷KPI，ε=(´ο｀*)))。

投递淘天集团等公司10个岗位

点赞评论收藏

分享

10-22 14:22

已编辑

门头沟学院 Java

同盾科技Java秋招面经

【一面】20min自我介绍栈和队列区别、应用场景线程池七大参数如果线程池队列无界，一直提交任务，会怎么样如何快速发现线程池有问题（回答做好线程池监控，问如果没有监控怎么办，回答用linux命令查看内存占用啥的）假如一个应用启动提示了端口冲突，如何排查是什么端口冲突了常用的linux命令有哪些微服务了解吗假如一个链路有50个微服务，怎么快速找到服务调用路径TCP三次握手、四次挥手对同盾的业务了解吗对加班怎么看接受海外吗 部分题目想不起来了反问：问业务：风控、信贷【二面】无领导小组，听说和其他岗一起玩，外面还下小雨，瞬间放弃

查看13道真题和解析

点赞评论收藏

分享

10-26 02:36

已编辑

四平职业大学机器学习

AI Infra秋招offer帮选

投票

介绍一下几个感兴趣的组我了解到情况：（1）蚂蚁集团：Base杭州，暑期实习的组，组里氛围很好，方向做的是：大模型推理优化+编译，但是岗位在开发序列，今年由于接了新业务，工作时长有所增加（早10晚9），之前是比较轻松（早10晚7），组里主管对我很重视，入职有机会独立负责较好的项目，并且主管的技术视野很好，有很好的技术嗅觉；（2）字节跳动：Base上海，Data推荐架构大组，小组是做国内平台垂类推荐系统的（头条、红果、西瓜等），不是主端（抖音），不过主端也是同一个大组，未来可能有机会内部活水，听面试官说的工作强度还可以，早10晚9，但是听网友说今年大组整体的变动比较大，但是心里对字节有所期待，毕竟是宇宙厂；（3）美团：Base上海，大模型基座做LoongCat的推理/算子的组，是从北斗计划流转到正式批的，没有再次面试，是一面面试官和我聊的比较好，直接从北斗那边捞回来的，LoongCat是团子目前最出名的模型吧，所以组也算比较核心；三个我都有觉得好的点，其他还有一些了解不多的offer，也请大家一块帮忙选一下，我个人觉得业务是否核心比较重要，对未来职业的发展会比较好，求各位大佬给出意见，并请各位大佬给出对应选择的理由还有小红书和腾讯还在面试流程中，不知道面过的概率大不大

我的求职进度条

点赞评论收藏

分享

10-13 10:24

已编辑

上海大学 Java

腾讯音乐后台开发一面

50分钟左右，问的问题都比较常规，但是面试官会一直深问，我回答的都比较浅，面试官不太满意，面完秒挂1.自我介绍2.java中String字符串的不可变性怎么理解3.JVM内存结构，堆和栈内存的划分，垃圾回收器，三色染色法4.一个对象是如何存放到jvm中的5.Netty的优点，在性能优化上做了哪些工作6.Zookeeper的结构，是CP的还是AP的（CP），可用性保证7.Redis中zset的数据结构，跳表查询的时间复杂度，为什么不用O(1)的数据结构8.MySQL中锁的种类，什么是间隙锁9.Redis高可用如何保证（宕机之后恢复）10.Zookeeper的领导选举机制11.进程和线程的区别12.进程之间如何通信13.反问

火猴大圣：回来继续学，实战-复盘总结-复习-再战，一般都是这个过程循环🔁，多数人不要想一次就过

查看12道真题和解析

点赞评论收藏

分享

评论

4

12

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 找实习是选平台还是选业务？ #

3302次浏览 33人参与

# 实习生如何通过转正 #

109739次浏览 1412人参与

# 腾讯音乐秋招 #

433086次浏览 4796人参与

# AI“智障”时刻 #

2391次浏览 28人参与

# 通信/硬件求职避坑tips #

122895次浏览 1051人参与

# 十一月总结 #

4935次浏览 56人参与

# 百度秋招 #

54024次浏览 391人参与

# 材料转码还有必要吗？ #

33277次浏览 155人参与

# 你面试时吹过最大的牛 #

8501次浏览 36人参与

# 应届生第一份工作最好去大厂吗？ #

91331次浏览 897人参与

# 产品面经 #

232952次浏览 2089人参与

# xxx岗位的一天 #

2304次浏览 21人参与

# 每个月花钱最多的地方是？ #

1948次浏览 24人参与

# 实习学到最有价值的工作习惯 #

42577次浏览 368人参与

# 办公室恋情是职场大忌吗 #

11442次浏览 21人参与

# 职场捅娄子大赛 #

433408次浏览 4172人参与

# 你的实习什么时候入职 #

319478次浏览 2165人参与

# 2023毕业生求职有问必答 #

212580次浏览 1659人参与

# 科大讯飞工作体验 #

30403次浏览 73人参与

# 蚂蚁求职进展汇总 #

134728次浏览 1215人参与

# 你知道哪些职场黑话？ #

66132次浏览 455人参与

# 招银网络科技工作体验 #

26551次浏览 95人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务