90分钟面经:智谱大模型

✅一面
✴️0、手撕: tokenizer,RAG基本流程(可伪代码) 
✴️项目: 
1、项目具体解决问题 
2、每个模块如何实现 
3、NL2SQL在处理多表查询的时候采取啥策略 
4、k8s和docker在项目中的作用 
✴️八股: 
5、对PPO DPO GRPO计算逻辑的理解 
6、对KL散度的三种估计的理解 
7、LoRA和p-tuning v2的区别,怎么初始化 
8、DeepSeek R1训练全流程,MLA具体怎么做的 
9、梯度爆炸和消失怎么处理的 
10、torch中register_parameter和buffer啥区别 
11、torch如何实现不记录梯度 
12、torch squeeze和unsqueeze干嘛的 
13、python设计删除流程的时候,若涉及可变和不可变对象该如何debug 
14、多机多卡和单机多卡的实现上有什么不同? 
15、tokenizer的输出?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。

全部评论
手撕: tokenizer,RAG基本流程(可伪代码) 这种是怎么做的?tokenizer怎么考察代码?还有rag
点赞 回复 分享
发布于 06-12 16:05 广东

相关推荐

Lorn的意义:你这种岗位在中国现在要么牛马天天加班,要么关系户进去好吃好喝,8年时间,真的天翻地覆了,对于资本来说你就说一头体力更好的牛马,哎,退伍没有包分配你真的亏了。
点赞 评论 收藏
分享
07-23 15:05
门头沟学院 Java
熊大不大:不好意思KPI数据刚刚刷新,刚刚达标
点赞 评论 收藏
分享
卡bg这么严,不是92真是太难了
投递芯原微电子(上海)股份有限公司等公司10个岗位
点赞 评论 收藏
分享
评论
4
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务