广东省通信服务-中数通(实习->转正)

无HR面只有技术面+主管技术面,岗位:大数据与AI工作室成员,本来是社招or校招,不过我说我会考虑实习到转正遂给offer

技术面(有项目经验可无八股文)

1、自我介绍(讲下来自哪个学校,学过什么,项目有什么,为什么选择来这里面试)

2、看到我简历里有Paper,问我是做什么的(论文主要是频繁挖掘,通过先验分布来节约数据规模)

3、看到CV方向的论文的paper,问我又是做啥的(主要是做三元组损失,怎么选正负样本对)

4、多模态的项目主要做啥(主要是CV&Audio,通过两个分支,最后简单的置信投票来实现分类)

5、面试官问我为什么不选择深造(因为不想读书,主要是楼主心浮气躁的,有点做不来研究)

6、K-means的k如何选取(我回答了按照业务,那个时候上个公司做业务做傻了,一般来说是轮廓法或者肘部法)

面试官对我的简历觉得非常好....哈哈哈哈哈哈哈(这个哥们人很好,入职后玩的很好)

主管面(闲聊,无项目,无八股)

1、懂不懂Transformer(懂,讲了下multi head attention,self attention(其实主管压根就不懂,不要问为什么,因为这货就是我的领导))

2、过了六级,平时读论文么,一般在哪看(web of science,IEEE Xplore,SCI-hub)

3、为什么不想考研(重复了一遍)

4、之前也在省电信旗下的子公司实习,觉得如何(因为那边没编制,只能签内部外包,感觉环境资源很少,因此想走)

5、期望薪资(当初年轻脸皮薄,说怎么开都可以吧,主要是想实习,钱不重要)

6、反问:

6.1、公司的资源怎么样有没有卡(回答有卡(实际上我入职一个月才有台4张A800的机子))

6.2、工作室的话,应用和研究怎么划分(60%应用,40%研究,实际上目前没怎么做业务,主要是打比赛,帮领导做课题)

6.3、多久能够入职(一般收到通过信息的3日左右)

评价:建议大家可以当作来实习,毕竟4张A800还是对于大部分的公司来说很难得(大厂当然就不一样了),对于非92的本科生实习的话还是合适的。并且团队里人都很好很nice(团队不包括领导,领导比较啰嗦,但其实也还好)。建议不要走校招,校招价格很低,先进来实习然后提出转正,然后谈薪资,能够比普通校招高大概20%(比如校招7.5k,你可以开10k,当然你要证明你的价值),好了,不能再透漏的,等下被我司HR看到就尴尬了

全部评论

相关推荐

1. 基础概念题:什么是大模型核心加速技术中的 “算子融合”?举例说明其作用。答案要点:算子融合是将多个连续计算算子合并为一个,减少计算图中的节点数和显存读写次数,降低延迟。举例:如将 Transformer 中的 Add(残差连接)与 RMSNorm(归一化)融合,减少两次内存访问,提升推理速度。2. 技术原理题:Flash Attention V2 如何优化注意力计算效率?与 V1 的核心区别是什么?答案要点:• V1:通过分块计算注意力,减少显存占用(避免存储所有中间键值对)。• V2:引入 “内外循环交换策略”,将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式,进一步提升计算效率,尤其在长序列场景下加速明显。3. 量化技术中,FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异?4. RAG 系统中,文档切分粒度如何影响检索和生成效果?实际中如何确定最优粒度?5.在长序列推理场景中,PagedAttention 和 Prefix Caching 分别解决什么问题?如何配合使用?答案要点:• PagedAttention:将 KV Cache 分块存储在非连续显存中,避免显存碎片,支持处理超长序列(如百万 Token);• Prefix Caching:缓存历史对话的 KV 对,跨请求复用,减少重复计算(如多轮对话中复用上文缓存)。配合逻辑:PagedAttention 解决显存限制,Prefix Caching 减少计算量,两者结合可提升长对话场景的效率和稳定性。6. 在企业级推理场景中,如何根据需求选择量化方案?举例说明短文本高并发和长文本场景的优化策略。实时客服系统用 INT4 量化加速响应;金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。
点赞 评论 收藏
分享
评论
7
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务