算法打工人阿旺

01-19 23:22 中山大学算法工程师发布于山东

关注

阿里巴巴大模型算法岗面经

1.实习经历穿插具体介绍
2.bceloss公式介绍用pe，优势在哪里
3.粗排有没有和精排有什么交互信息
4.序列建模的基线模型是什么
5.Linux常用命令有哪些，如何用Linux命令在两服务器间传数据
6、如何降低KV cache
7、讲讲DeepSeek中的MLA
8.讲讲最开始的自注意力机制发展到当今的一个优化路线
9.手撕最长公共子串
1.合并有序数组（双指针）
2.搜索插入位置（二分）
3.分析一下din的attention和transformer的注意力机制有什么不同
4.实习的模型更新的时期是按天为单位还是按小时为单位？
5.ESMM模型后面的论文了不了解？
6.DeepFM的FM侧是如何计算的？
7.dense类的特征可以拿来做embedding吗？
8.解释一下梯度消失的处理策略
9.手撕多头注意力，询问其变体和设计思路，以及添加策略
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

大连理工大学电气设计工程师

谢谢大佬

点赞回复分享

发布于 01-20 18:11 辽宁

01-09 15:34

门头沟学院 Java

百度实习一面面经

全程40min一、自我介绍二、项目拷打三、八股文1、Java基础HashMap线程不安全 如何证明？介绍一下ConcurrentHashMap底层原理synchronized和Lock有什么区别创建线程池有哪些方式为什么要用线程池给定线程池参数（核心 10 / 最大 20 / 队列 30），提交 100 个执行时间无限长任务的执行流程能说说CAS吗？ CAS可能会产生什么问题 ? (回答的ABA问题) CAS是乐观锁还是悲观锁 ?(乐观锁)了解ThreadLocal吗 它作用是什么 可以通过它让多个线程共享数据吗2、JVM相关现在项目出现了OOM问题，你该如何排查JVM参数调优了解过吗JVM可...

点赞评论收藏

分享

01-20 16:12

北京信息科技大学 Python

雄岸科技——大模型算法面经

1.自我介绍；2.本科毕设项目介绍；3.Retinaface和Facenet的具体网络模型；4.Retinaface是如何检测人脸的，Facenet是如何识别人脸的；5.项目的创新点有什么，评判指标是什么；6.检测和识别用的时间，其中esp8266，mg996r分别是做什么用的；7.大模型量化比赛项目介绍；8.AWQ和GPTQ是什么；9.什么模型适合用AWQ，什么模型适合用GPTQ；10.其中最优的参数是怎么得到的；11.llm- benchmarker怎么用的，是什么评判指标；12.了解算子吗？（marlin kernel）详细说一下这个算子是什么；13.除了量化其他的方法了解吗？（压缩、减枝、LoRA）14.LoRA是什么；QLoRA是什么？为什么要用LoRA；15.具体的原理是怎么样的；16.如何将LoRA结合到TransFormer各个层？17.介绍一下TransFormer的架构；18.Encoder和Decoder是由什么组成的；19.MHA细节是怎么样的(QKV)，softmax是干什么用的；20.单头注意力和多头注意力有什么区别；21.为什么MHA下面要除根号d；22.潜在多头注意力了解吗，多头注意力的作用；23.FFN详细说一下；24.残差链接有什么用；25.Layer Normalization有什么用；26.Layer Normalization和Batch  Normalization的区别；27.Qwen3的基础架构是怎么样的；28.Qwen3和Qwen2.5相比有什么区别；29.Qwen3和DeepSeek有多少个头；30.大模型要训练出思维链应该如何训练；31.如何平衡精度和推理速度，怎么做trade off的；32.了解Agent吗，做过什么agent项目33.Dense模型是什么；34.MoE、MLA是什么，详细讲一下；35.LoRA的偏置矩阵详细说一下，为什么LoRA初始化A要正态分布，B要初始化为0；36.秩是什么意思；怎么理解；37.Qwen3哪里做的好；38.快手实习项目介绍；39.经纬恒润实习项目介绍；40.了解量化交易吗；41.你平时做交易是趋势还是阶段？

你最近因为什么迷茫？

点赞评论收藏

分享

01-12 14:45

门头沟学院 C++

头牌项目该怎么写

很多同学按“时间顺序”写简历，把最近做的（往往是还没做完的毕设）放在第一个，或者把课程大作业放在第一个。大错特错！简历的第一个项目必须是面向这个岗位的王炸。它决定了面试官是问你底层原理还是问你平时有什么爱好。今天聊聊简历里的头牌项目该怎么打造。1️⃣ 选哪个项目做头牌？(Selection)原则：相关性 > 完整度> 技术如果你投算法岗 ：必须放那个你啃过论文、改过模型结构、有指标提升的项目。 证明你有科研能力和 SOTA 复现能力。如果你投后端/工程岗 (C++/Java)：必须放那个涉及到“高并发、多线程、性能优化”的项目，哪怕这个项目只是个大作业，但如果你在里面用了线程池、环...

简历第一个项目做什么

点赞评论收藏

分享

01-10 23:15

山东大学算法工程师

小红书大模型算法实习二面

1️⃣实习介绍2️⃣基本就是顺着简历全在问八股1.Transformer 的结构，有哪些可以学习的参数2.多头自注意力结构，矩阵个数3.ffn结构4.encoded decoder 区别5.一个 decoder block 由几个部分组成6.encoder 的输出，作为什么到 decoder7.为什么 decoder 更适合生成8.decided mask 在推理中有用吗9.Transformers 各个架构的改进（attention/ffn/位置编码）分为：10.GQA MHA MQA 区别11.swiGLU 的改进12.rope 在哪里加入3️⃣然后开始项目，其实也问很多八股：1.用的什么开源 dpo 数据2.为什么没用 qwen-33.全参数微调 7B 需要多少显存4.FP16/BF16 区别5.AdamW 显存计算6.介绍 Flash attention7.介绍 gradient checkpoint8.RougeL 计算方法9.代码：找数组第 k 大元素

查看21道真题和解析

点赞评论收藏

分享

01-15 11:00

北京邮电大学嵌入式工程师

爽文亲临,从面试到offer全流程体验

每年 秋招（9~12 月）和春招（2~5 月），成千上万的计算机专业学生涌入求职市场。很多同学在求职过程中，会遇到各种 踩坑 问题：简历投递无反馈？笔试、面试总是卡壳？通过技术面却被 HR 卡？拿到 Offer 却发现是坑？这篇文章将详细拆解秋招/春招的全流程，并告诉你如何避坑，帮助你顺利拿到 Dream Offer！1. 求职时间线规划秋招 vs. 春招：有什么区别？规模大（主要针对应届生）小（补录 & 实习转正机会）竞争高，提前批 & 正式批竞争激烈相对较低，但岗位有限招聘企业互联网大厂、金融、国企、独角兽等补录岗位，部分公司有批量招聘求职策略提前准备，重点关注提前批 &a...

点赞评论收藏

分享

评论

1

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 上班以后，你还有哪些坚持的爱好？ #

4455次浏览 123人参与

# 实习教会我的事 #

50128次浏览 383人参与

# 你都在哪些场所面过试？ #

12315次浏览 166人参与

# 拼多多工作体验 #

43826次浏览 283人参与

# 哪些公司开春招了？ #

4808次浏览 85人参与

# 为了实习逃课值吗？ #

61419次浏览 515人参与

# 工作压力大怎么缓解 #

134881次浏览 1190人参与

# AI coding的好用工具分享 #

11283次浏览 267人参与

# 实习怎么做才有更好的产出 #

7401次浏览 156人参与

# 找工作以来，你最看不惯__ #

6990次浏览 183人参与

# 实习生工资多少才算正常？ #

8614次浏览 163人参与

# 你最近因为什么迷茫？ #

23414次浏览 365人参与

# 实习离职怎么跟领导说 #

75085次浏览 417人参与

# 你给AI提过哪些离谱的需求？ #

3856次浏览 126人参与

# 领导做过最不靠谱的事 #

7963次浏览 156人参与

# 牛客AI文生图 #

19125次浏览 225人参与

# 机械/制造每日一题 #

84387次浏览 1440人参与

# 实习学不到东西怎么办？ #

270710次浏览 2491人参与

# 工作一周年分享 #

49416次浏览 249人参与

12412次浏览 49人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务