算法打工人小旺

12-08 17:36 中山大学算法工程师发布于山东

关注

小米 AI 大模型面试

1.自我介绍＆项目深挖
2.针对 RAG 项目
3.使用的 Embedding 模型结构是什么？输出向量维度是多少？
4. Transformer 更新哪些参数？
5.如何缓解大模型的幻觉问题？
6.请描述 Transformer 的基本结构，并解释自注意力机制。
7.输入向量的维度是多少？
8.LayerNorm 是对哪个维度做归一化？
9.你了解哪些微调方式？
10.如何优化大模型的训练和推理效率？
11.Prompt Tuning 和 P - Tuning 的区别是什么？
12.如何让大模型处理更长的文本？
13.代码能力考察:请手写反转链表。

📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

12-10 23:28

已编辑

门头沟学院嵌入式软件工程师

嵌入式所有可投公司总结

我把秋招投递过的所有公司做分类总结，几乎就是每年校招和实习中，所有嵌入式软件可以投递的公司，以方便大家投递🧠 芯片与算力 地平线、黑芝麻、寒武纪、平头哥半导体、芯动、全志科技、南芯、辉芒微、比特大陆、芯驰、得一微、中科蓝讯、华大半导体、复旦微、国科微、砺算科技、中兴微电子、星宸科技、诺瓦星云、艾为电子、安谋科技、瑞明技术、汇顶科技🚗 自动驾驶与智能车 小马智行、文远知行、佑驾创新、卡尔动力、易控智驾、德赛西威、斑马智行、禾赛科技、联合电子、成谷科技、道通科技、经纬恒润、蔚来、理想、小鹏汽车、零跑汽车、塞力斯、上汽、长安汽车、奇瑞汽车、东风日产🤖 机器人/无人机 大疆、拓竹科技、追觅、优必...

嵌入式速成指南

点赞评论收藏

分享

12-09 22:29

中山大学算法工程师

阿里大模型面经汇总

1.  注意力机制：请简述 MHA、MQA 和 GQA 三种注意力机制的核心区别。2.  模型架构：Dense 模型与 MoE 模型有何本质区别？3.  路由机制：MoE 模型中，路由（Routing）机制具体是如何工作的？4.  LoRA 微调：请阐述 LoRA 的原理，以及其中 A、B 矩阵的初始化方式和秩（Rank）的设置考量。5.  强化学习：请对比 DPO、PPO 和 GRPO 的原理与区别，并写出 DPO 的 Loss 函数公式。6.  推理加速：vLLM 中使用了哪些关键技术（如 PagedAttention、KV Cache）来优化推理？7.  并行框架：你对 DeepSpeed 这一加速推理与训练框架有多少了解？8.  BM25 算法：请讲解 BM25 算法的计算原理。9.  负载均衡：MoE 模型中专家（Expert）的负载不均衡问题该如何解决？10.  损失函数：能否通过修改损失函数的方式来缓解 MoE 的负载均衡问题？11.  数据分布：SFT 微调数据与预训练数据分布差异较大时，该如何处理？12. Scaling Law：SFT 微调的数据集是越大越好吗？是否存在 Scaling Law 现象？13. 训练稳定性：强化学习（RL）为何存在训练不稳定的问题？既然不稳定为何业界仍广泛使用？14. 三数之和：LeetCode 15. 三数之和。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

点赞评论收藏

分享

12-04 19:40

哈尔滨工业大学算法工程师

现在开始学大模型应用开发明年找工作来的及吗？

如题，bg双九，研二学生，电子信息专业，课题是集群异常检测与影响评估软件开发相关的，目前无实习无论文，项目大都是飞行器健康管理相关的，现在想学习大模型应用开发方向并与课题结合起来做agent，然后找大模型应用开发相关的实习与工作，希望大家能提供思路和分析及可靠学习路线，十分感谢！

点赞评论收藏

分享

12-09 18:15

陕西师范大学算法工程师

腾讯混元大模型算法一面-26校招

1．项目介绍，过实习，讲论文，根据表述实时跟进询问交流2．讲一下大模型训练和推理的流程， SFT 和 RLHF 的作用分别是什么3．为什么探索 MoE 架构， MoE 相比 Dense 有什么好处4．有没有全量微调过5．推导一下神经网络反向传播的过程6．在 RLHF 中，目前主流的强化学习算法有哪几个，写一下损失函数的表达式7．一道排列组合的概率题8．平常有用过 RLHF 吗，简单介绍一下9. 开放题：对目前大模型的发展有什么看法10.代码：多头自注意力

查看10道真题和解析

点赞评论收藏

分享

12-05 20:53

门头沟学院人工智能

大模型部署和部署优化全流程，都看过来。

首先讲为什么写这篇啊，因为现在基本上都是开源模型的，然后大量的公司需要自己的数据和样本，所以非研究院这种，基本上都是开源模型二开，所以说基本上都是调试出自己的模型，部署在自己的显卡上。那么这里就有专门的一个岗位，大伙可以去搜，叫模型部署的岗位，不过只有大公司才会有，一般的话，都是顺手全干完的。比如我hhh，我一个人能顶人家几个，有时候能力越大，干活越多，而不想干活，就要装糖，然后能力越小，所以说能力越大，能力越小。ok，正式开始啊，上面讲了为什么要部署自己的模型，这里我默认，你知道有ollma这个种东西，也默认你已经下载好了模型，有自己的显卡。比如说你下载了个各方面都很好的，自我感觉良好的模型...

大模型集合

点赞评论收藏

分享

评论

点赞

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# mt对你说过最有启发的一句话 #

4579次浏览 68人参与

# 考研失败就一定是坏事吗？ #

161075次浏览 1142人参与

# 被上班搭子“传染”了哪些习惯 #

1729次浏览 50人参与

# 今年秋招你收到了多少封邮件？ #

4091次浏览 78人参与

# 工作后，你落下了哪些病根 #

4270次浏览 101人参与

# 秋招特别不鸣谢 #

3373次浏览 46人参与

# 非技术2024笔面经 #

446688次浏览 4911人参与

# 选实习，你更看重哪方面？ #

3433次浏览 60人参与

# 工作后明白的那些道理 #

36754次浏览 497人参与

# 什么是优秀的实习经历 #

1531次浏览 53人参与

# 巨人网络求职进展汇总 #

181603次浏览 1214人参与

# 摸鱼被leader发现了怎么办 #

77426次浏览 449人参与

# 工作中遇到的歹人 #

6680次浏览 117人参与

# 你见过最离谱的招聘要求是什么？ #

246687次浏览 1697人参与

# 秋招感动瞬间 #

109823次浏览 497人参与

# 选完offer后，你后悔学机械吗？ #

49367次浏览 270人参与

# 当发现同事想辞职 #

12426次浏览 39人参与

# 校招泡的最久的公司是哪家？ #

46296次浏览 172人参与

# 分享一个让你热爱工作的瞬间 #

53466次浏览 467人参与

# 上班到公司第一件事做什么？ #

115799次浏览 811人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务