2023-09-08 21:07 清华大学算法工程师

关注

实习生2周跑路，玉玉

招了个bjtu的实习生，没让干过一点业务，也没让加过班，研究的都是LLM，结果2周跑路。玉玉了，正在秋招的同学就别找实习，干2周跑路太坑了。#实习与准备秋招该如何平衡#

全部评论

推荐最新楼层

牛客148834545号

门头沟学院 Java

bjtu给你道歉了，希望别拉黑我们学校

32 回复分享

发布于 2023-09-09 12:56 北京

赛文X

腾讯_后台开发

这个时间就别招应届生了😌

14 回复分享

发布于 2023-09-08 21:31 广东

我就想965双休怎么你了

门头沟学院算法工程师

可能入职之前以为能cover，实际顶不住吧😂

11 回复分享

发布于 2023-09-10 15:44 北京

瘦肉丸er

西藏农牧学院智能驾驶系统工程师

同24在实习，白天上班，晚上投简历，还有学校项目的事，真的有点累😭

9 回复分享

发布于 2023-09-10 19:36 浙江

鹅鹅就行

湖南大学 Java

最后一天

4 回复分享

发布于 2023-09-11 11:47 广东

破防者

北京交通大学后端

bjtu给你道歉了，希望别拉黑我们学校！

2 回复分享

发布于 2023-11-03 15:08 北京

这一生如履薄冰

门头沟学院算法工程师

老哥我想去你们那里实习LLM 可以六个月以上

2 回复分享

发布于 2023-09-18 22:42 北京

爱刷美剧的土拨鼠许愿简历通过

未填写教育信息机械设计/制造

bjtu是什么大学啊？

2 回复分享

发布于 2023-09-10 18:18 黑龙江

suc16

楼主

清华大学算法工程师

评论区的朋友们有找实习的吗，我们的第2个实习生干了4个多月被老师叫回学校了，来过的都说好。

1 回复分享

发布于 2024-01-17 14:20 北京

奔跑的秋招人_毕业回归版

电子科技大学算法工程师

找了实习然后没有入职直接拒了就怕秋招冲突

1 回复分享

发布于 2023-09-17 02:51 浙江

男猫

The University of Sydney 产品经理

我就是边秋招边实习，也是刚入职不到一个月，现在想溜了😭

点赞回复分享

发布于 2023-10-07 18:53 北京

06-04 16:38

郑州大学算法工程师

面试字节大模型（LLMs）RAG面被问麻了~

LORA 原理：解释 LORA(Low-RankAdaptation)的核心思想，如何通过低秩矩阵实现参数高效微调?数学形式如何表达?Self-Attention机制：自注意力机制中 O/K/ 矩阵的作用是什么?如何通过缩放点积计算注意力权重?公式推导并解释Softmax 的意义。位置编码：Transformer为何需要位置编码?主流 LLM(如 LLaMA、GPT)使用哪种位置编码(如 ROPE)?相比绝对/相对位置编码有何优势?Seq2Seg 模型：Seq2Seq模型的核心组件是什么?Encoder-Decoder结构如何解决长程依赖问题?RAG技术：RAG(检索增强生成)的完整链路包含哪...

点赞评论收藏

06-04 15:31

门头沟学院算法工程师

大模型面经每日总结

网易大模型量化面经0.常见的量化方法有哪些？原理及适用场景，并分析它们在计算复杂度和精度损失上的差异1.PTQ 和 QAT 咋选？2.低比特量化在智能音箱能用吗？3.语音识别量化有啥难题和办法？4.模型量化和其他压缩技术配合经验5.QAT中，量化噪声模拟的作用是什么？6.在多头注意力机制 前馈神经网络 ，量化策略有何不同?7.针对 ARM 架构的芯片 如何优化量化模型的推理速度?

查看8道真题和解析

点赞评论收藏

05-29 23:43

西安交通大学算法工程师

继续实习or换实习

lz目前在北京某大厂实习，做的是大模型，虽然没什么对外产品，但是好处是组里卡管够，每天就是看论文，写实验。自己有idea随时可以尝试，不用做什么业务。目前已经实习三个月有余。现在有csig某部门的大模型业务相关offer，可能去了的话就是纯大模型应用，好像做的是用llm做代码安全审查，可能就偏向业务了。优点：tx title更大，就算不能转正也能背书缺点：csig，可能干业务，可能来不及转正以及转正率不高

点赞评论收藏

06-14 08:16

点赞评论收藏

05-28 20:13

中山大学算法工程师

强度拉满:网易大模型算法岗

1️⃣一面 时间：9.12  时长：1hcode：统计岛屿数量、最大岛屿面积，DFS方法解了然后介绍实习项目，面试官非常耐心地听，没有打断八股1.bert和gpt的区别？（从模型架构、训练方式、使用场景方面回答的）2.训练/微调一个LLM的流程？3.实习时用的 megatron 框架吗，对分布式训练框架了解多少？（回答了deepspeed和megatron区别，以及几种并行方式，以及deepspeed的三种zero）4.了解强化学习吗，跟SFT有什么区别？5.反问：业务，对岗位的期望💣评价：有点紧张，算法题有一个小失误没注意到2️⃣二面时间：9.14  时长：1h八股1.写一下 attention 公式（代码实现了下）2.训练时为什么要mask，推理时也需要吗？两处有什么区别？推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别？4.计算attention时为什么要除以d_k，这个d_k的含义是？5.attention计算时还有哪些scale处理？6.attention中softmax函数作用、公式、为什么有减去最大值的处理？换个函数还能这样处理吗？7.解释数值上溢、下溢问题8.讲一下prompt书写的经验，如何判断prompt是否达标，如何改进prompt9.讲一下SFT，会对哪部分计算loss？为什么？10.讲一下deepspeed11.训练用一个7b模型要占用多少显存？不同zero阶段能够节省多少显存？12.训练模型时用了几张卡，有遇到什么异常中断问题吗？反问： 在乎候选人什么能力？对面试表现有哪些改进意见？💣评价： 基础不够扎实，网上有的知识都能回答上来，在同龄人里算比较优秀，欠缺一些多机多卡实践经验。

查看17道真题和解析

点赞评论收藏

招聘动态

现代汽车前瞻技术研发挑战赛

拼多多集团-PDD

2026届秋季校招提前批

滴滴

2026届秋季校招提前批

Touch CIB

数字兴业科技挑战赛

26届校招投递表格

7月更新166条网申投递链接

快手

快Star-X特别技术人才计划启动

京东2026

全站热榜

创作者周榜

正在热议

# 除了主业以外，你还有哪些其他收入？ #

# 一人推荐一个值得去的通信/硬件公司 #