2019-09-26 16:22 已编辑昆仑芯_上海研究院_深度学习框架研发工程师

关注

求了解苏州momenta研发实习生？

这个岗位是干嘛的#Momenta##岗位评价##实习#

全部评论

推荐最新楼层

哈尔滨理工大学 Java

我同学在哦工作时间很长觉得自己扛得住的可以去

点赞回复分享

发布于 2019-09-26 15:06

01-08 05:25

北京大学算法工程师

阿里多模态大模型算法二面-实习面经

1.项目经历2.模型的 loss 函数前乘以10，会对训练造成什么影响？3.deepseek v3的 rope 实现？ deepseek r1的训练过程？4.做过 rag 是吗？介绍 graph rag ?5.bge 和 gte 模型怎么训练的？为什么不能直接用 bert - base 来做余弦相似度召回？6.对比学习的常用 loss 有哪些？ InfoNCE 的超参数？温度系数对训练的影响？7. gradient checkpointing 原理？ gradient _ accumulation 原理？8.多模态大模型的预训练原理？预训练一般分为几个阶段？ ViT 现在一般用什么方法进行预训练？9. 手撕：梯度下降求平方根。

查看9道真题和解析

点赞评论收藏

分享

01-10 22:35

浙江大学算法工程师

小红书大模型算法实习一面

1️⃣ 实习介绍2️⃣ 拷打 rag 项目：1.项目还可以提升的地方2.感觉自己可以多久完成这个项目3.dpo训练对于系统问答的优化在哪里4.提高模型的准确率核心是什么5.怎么提高数据的质量6.rag 文档怎么切分7.rag 向量化的模型8.rerank 用的什么模型9.有没有微调 rerank 模型/应该怎么微调10.dpo 用的什么库11.代码：已知无序数组，求第 k 大数

查看11道真题和解析

点赞评论收藏

分享

01-29 19:29

已编辑

北京信息科技大学算法工程师

雄岸科技——大模型算法面经

1.自我介绍；2.本科毕设项目介绍；3.Retinaface和Facenet的具体网络模型；4.Retinaface是如何检测人脸的，Facenet是如何识别人脸的；5.项目的创新点有什么，评判指标是什么；6.检测和识别用的时间，其中esp8266，mg996r分别是做什么用的；7.大模型量化比赛项目介绍；8.AWQ和GPTQ是什么；9.什么模型适合用AWQ，什么模型适合用GPTQ；10.其中最优的参数是怎么得到的；11.llm- benchmarker怎么用的，是什么评判指标；12.了解算子吗？（marlin kernel）详细说一下这个算子是什么；13.除了量化其他的方法了解吗？（压缩、减枝、LoRA）14.LoRA是什么；QLoRA是什么？为什么要用LoRA；15.具体的原理是怎么样的；16.如何将LoRA结合到TransFormer各个层？17.介绍一下TransFormer的架构；18.Encoder和Decoder是由什么组成的；19.MHA细节是怎么样的(QKV)，softmax是干什么用的；20.单头注意力和多头注意力有什么区别；21.为什么MHA下面要除根号d；22.潜在多头注意力了解吗，多头注意力的作用；23.FFN详细说一下；24.残差链接有什么用；25.Layer Normalization有什么用；26.Layer Normalization和Batch  Normalization的区别；27.Qwen3的基础架构是怎么样的；28.Qwen3和Qwen2.5相比有什么区别；29.Qwen3和DeepSeek有多少个头；30.大模型要训练出思维链应该如何训练；31.如何平衡精度和推理速度，怎么做trade off的；32.了解Agent吗，做过什么agent项目33.Dense模型是什么；34.MoE、MLA是什么，详细讲一下；35.LoRA的偏置矩阵详细说一下，为什么LoRA初始化A要正态分布，B要初始化为0；36.秩是什么意思；怎么理解；37.Qwen3哪里做的好；38.快手实习项目介绍；39.经纬恒润实习项目介绍；40.了解量化交易吗；41.你平时做交易是趋势还是阶段？------二更已oc

你最近因为什么迷茫？

点赞评论收藏

分享

01-08 10:15

门头沟学院 Java

快手大模型算法二面-实习面经

1．问实习和论文2．讲一下 LoRA ，两个权重矩阵一般怎么初始化，能都全0吗3．除了 LoRA ，还了解哪些可以进行训练推理优化的技术4．现在的多模态大模型，动态分辨率一般都是怎么做的，位置编码怎么设计5．平常训练或者微调 LLM 或者VLM，有什么感受6. 专家划分子空间是区分不同任务但有时候并不能取得理想的效果这是为什么7. 概率题，一副扑克牌，去掉大小王，随机抽两张，花色相同的概率8. 场景题：目前有一个带货的直播间，设计一个方案，商品比较多怎么降低时延

查看8道真题和解析

点赞评论收藏

分享

01-11 22:00

中山大学算法工程师

腾讯大模型算法岗面经

1.自我介绍及项目经历2.如何增强模型的多轮对话能力？3.介绍MoE （混合专家）架构核心优势。4.阐述大模型训练与推理的完整流程。5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。6.FlashAttention v1 和 v2 的主要改进点分别是什么？7.CoT（Chain-of-Thought）训练数据是如何构造的？8.当前主流的强化学习算法有哪些？9.代码：LeetCode 22，实现“括号生成”问题。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。大模型  人工智能就业 #校

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客吐槽大会 #

27617次浏览 331人参与

# 一份好的简历长什么样？ #

23431次浏览 432人参与

# 材料专业就业可以去哪些企业岗位 #

55097次浏览 379人参与

# 设计人秋招体验最好的公司 #

80988次浏览 735人参与

# 招聘要求与实际实习内容不符怎么办 #

166331次浏览 922人参与

# 机械人选offer，最看重什么？ #

158542次浏览 798人参与

# 你觉得机械有必要实习吗 #

73461次浏览 487人参与

# 我的秋招总结 #

280482次浏览 4334人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

8530次浏览 223人参与

# 在大厂上班是一种什么样的体验 #

16586次浏览 228人参与

# 机械人避雷的岗位/公司 #

45283次浏览 321人参与

# 正在实习的你，有转正机会吗？ #

480585次浏览 3071人参与

# 你的mentor是什么样的人？ #

51829次浏览 743人参与

# 现在还是0offer，延毕还是备考 #

1283251次浏览 7924人参与

# 论秋招对个人心气的改变 #

17524次浏览 258人参与

# 我和mentor的爱恨情仇 #

106946次浏览 971人参与

# 牛客AI体验站 #

10554次浏览 238人参与

# 设计人的面试记录 #

187494次浏览 1607人参与

# 秋招落幕，你是He or Be #

54798次浏览 620人参与

# 制造业的秋招小结 #

142365次浏览 2086人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务