春招笔录
真的流程太久太久了,至今没有0,offer有没有大佬捞一捞

1.阿里 简历挂
2.京东   做完笔试一直初试待筛选
3.bilibili 简历一直待筛选
4.拼多多 已走完面试流程,等综合评估及后续
5.美团 笔试后,一直显示笔试中
6.万兴 简历筛选中
7.唯品会 简历筛选中
8.百度 简历筛选过,等笔试,很久了大概没了
9.百奥 简历筛选中
10.中国联通 显示hr 已查阅,不懂
11.Cvte  一面结束,等结果
12.fordeal 走完面试流程,等结果
13.4399 笔试结束5天,等结果,流程中
14.三七  简历挂
15.有车以后 简历刚投
16.顺丰 网申中
17.立白 企业处理中???
18.趣丸 HR初筛

全部评论
求京东笔经
1 回复 分享
发布于 2023-03-17 23:37 北京
+1 也没offer
1 回复 分享
发布于 2023-03-17 15:19 北京
现在4月了,运营商那边有进展吗
点赞 回复 分享
发布于 2023-04-07 01:27 广东
联通给信了嘛
点赞 回复 分享
发布于 2023-04-03 16:39 浙江
拼多多有几面呀?
点赞 回复 分享
发布于 2023-03-17 19:15 江苏
要看看联想吗?看我帖子
点赞 回复 分享
发布于 2023-03-17 08:32 广东

相关推荐

1. 基础概念题:什么是大模型核心加速技术中的 “算子融合”?举例说明其作用。答案要点:算子融合是将多个连续计算算子合并为一个,减少计算图中的节点数和显存读写次数,降低延迟。举例:如将 Transformer 中的 Add(残差连接)与 RMSNorm(归一化)融合,减少两次内存访问,提升推理速度。2. 技术原理题:Flash Attention V2 如何优化注意力计算效率?与 V1 的核心区别是什么?答案要点:• V1:通过分块计算注意力,减少显存占用(避免存储所有中间键值对)。• V2:引入 “内外循环交换策略”,将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式,进一步提升计算效率,尤其在长序列场景下加速明显。3. 量化技术中,FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异?4. RAG 系统中,文档切分粒度如何影响检索和生成效果?实际中如何确定最优粒度?5.在长序列推理场景中,PagedAttention 和 Prefix Caching 分别解决什么问题?如何配合使用?答案要点:• PagedAttention:将 KV Cache 分块存储在非连续显存中,避免显存碎片,支持处理超长序列(如百万 Token);• Prefix Caching:缓存历史对话的 KV 对,跨请求复用,减少重复计算(如多轮对话中复用上文缓存)。配合逻辑:PagedAttention 解决显存限制,Prefix Caching 减少计算量,两者结合可提升长对话场景的效率和稳定性。6. 在企业级推理场景中,如何根据需求选择量化方案?举例说明短文本高并发和长文本场景的优化策略。实时客服系统用 INT4 量化加速响应;金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。
点赞 评论 收藏
分享
评论
2
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务