算法面经3:nlp和llm,商汤科技

商汤 LLM (2+0)🥲 二面后挂了
1. 主要是以项目为主,讲完项目,提问发散问题以及八股。
2. Baichuan2-7B的架构讲一下,有什么特别之处?
3. Lora微调7B模型,可训练参数是多少?显存占用如何?
4. 介绍下Lora以及qlora的区别
5. 其它多模态对齐方式有哪些?
6. LSTM与Transformer的区别,以及后者的优势?
7. 讲解下scaling law
8. 预训练一般分为哪些阶段,每个阶段的特点有何区别?
#春招# #实习# #秋招# #ai算法工程师# #大模型# #nlp算法工程师# #商汤科技#
全部评论
佬几个项目
点赞 回复 分享
发布于 03-17 11:02 辽宁

相关推荐

1️⃣一面时间:9.12  时长:1hcode:统计岛屿数量、最大岛屿面积,DFS方法解了然后介绍实习项目,面试官非常耐心地听,没有打断八股1.bert和gpt的区别?(从模型架构、训练方式、使用场景方面回答的)2.训练/微调一个LLM的流程?3.实习时用的 megatron 框架吗,对分布式训练框架了解多少?(回答了deepspeed和megatron区别,以及几种并行方式,以及deepspeed的三种zero)4.了解强化学习吗,跟SFT有什么区别?5.反问:业务,对岗位的期望💣评价:有点紧张,算法题有一个小失误没注意到2️⃣二面时间:9.14  时长:1h八股1.写一下 attention 公式(代码实现了下)2.训练时为什么要mask,推理时也需要吗?两处有什么区别?推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别?4.计算attention时为什么要除以d_k,这个d_k的含义是?5.attention计算时还有哪些scale处理?6.attention中softmax函数作用、公式、为什么有减去最大值的处理?换个函数还能这样处理吗?7.解释数值上溢、下溢问题8.讲一下prompt书写的经验,如何判断prompt是否达标,如何改进prompt9.讲一下SFT,会对哪部分计算loss?为什么?10.讲一下deepspeed11.训练用一个7b模型要占用多少显存?不同zero阶段能够节省多少显存?12.训练模型时用了几张卡,有遇到什么异常中断问题吗?反问: 在乎候选人什么能力?对面试表现有哪些改进意见?💣评价: 基础不够扎实,网上有的知识都能回答上来,在同龄人里算比较优秀,欠缺一些多机多卡实践经验。  
查看17道真题和解析
点赞 评论 收藏
分享
📍面试公司:深圳即构科技💻面试岗位:前端实习❓面试问题:1.拷打LLM大模型项目:(1)实现的过程中遇到的跳转,以及怎么解决  答:简单讲了markdown渲染和流式输出的实现(说的很简单)        遇到的问题:多端适配(只讲了媒体查询实现)2.拷打智能家居项目:(1)技术选型,架构设计  答:简单讲了uniapp的优点,websocket的优点3.八股(1)比较vue2和vue3,vue3好在哪里答:响应式原理vue3可读性更好,API(这块答的不好)(2)vue双向绑定原理答:只用过,原理大概prop监听?(答的稀烂)(3)css盒模型正常回答,(他说我笔试做错了这道题,我忘了怎么这个题都能错)(4)事件循环机制答:先同步,再微任务,再宏任务(让我说了哪些微任务,哪些宏任务)(5)typescript里interface和type都可以用来定义对象吗答:不太懂typescript(6)CI CD流水线的实现答:简单说了用gitlab实现(7)虚拟滚动的原理(8)前端的其他性能优化答:防抖、节流、图片懒加载4.开放问题(1)前端的未来发展,AI的影响答:前端与人交互性强,AI代替不了,但可以用AI帮助开发(大概这种)(2)在项目开发里充当leader,临近deadline,发现了依赖第三方库的bug,怎么解决答:随便乱说的5.反问(1)实习生具体做什么(2)我哪些方面需要加强  表达能力可以,但是让我主动说自己的亮点,讲讲问题怎么解决的(3)面试结果什么时候出🙌面试感想:感觉答的还凑合,但让我说亮点 ,事实上没什么亮点hhhh
点赞 评论 收藏
分享
评论
6
27
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务