博世面试

面试官迟到二十多分钟,一点技术问题都没有,嬉皮笑脸的感觉没被尊重,还以为博世外企风格会有比较好的面试体验呢三天九面,博世面试体验最差 #24届秋招就业#
全部评论
博世面试官连摄像头都不开,全程就我开着摄像头,一点不尊重面试者。
1 回复 分享
发布于 2023-09-20 10:03 北京
巨佬,可以来试试我司,恒玄科技,可以搞。见我主页。
1 回复 分享
发布于 2023-09-02 02:38 上海
同学试试速腾聚创吗,base上海/深圳,面试体验都是五星好评~欢迎私信~ https://www.nowcoder.com/feed/main/detail/5558db0b575847aeb2a0de8bd8d157d4
1 回复 分享
发布于 2023-09-01 09:13 上海
师弟,可以进我主页看看我司,24届sp批招聘开始了
1 回复 分享
发布于 2023-08-31 18:54 北京
博士不是据说里面学历都挺一般的吗
点赞 回复 分享
发布于 2023-09-07 09:11 上海
需要英文沟通吗
点赞 回复 分享
发布于 2023-09-04 22:19 湖南
佬是正式批吗
点赞 回复 分享
发布于 2023-09-01 20:13 四川
可以考虑一下荣耀,南京上海需求充足,hc多多,实习笔试通过的可以免秋招笔试,https://www.nowcoder.com/share/jump/219205181168962477
点赞 回复 分享
发布于 2023-08-31 22:41 江苏
一面吗,能写个面经吗
点赞 回复 分享
发布于 2023-08-31 20:03 江苏
杭州base的嘛好离谱
点赞 回复 分享
发布于 2023-08-31 17:07 新加坡
面试技术又怕你不会😂😂😂
点赞 回复 分享
发布于 2023-08-31 16:53 江苏

相关推荐

AI大模型算法,一环扣一环的拷打Transformer 基础详细介绍 Transformer 架构(Encoder-Decoder 结构、位置编码、FFN 等)Decoder 的因果注意力中,Q、K、V 分别来自哪里?→ Q 来自当前 Decoder 输入(已生成的 token 序列),K 和 V 也来自同一序列(需 mask 未来信息)Attention 为什么要 scaled?不做会怎样?为什么是√dₖ?→ 点积随 dₖ增大会让 softmax 进入饱和区,导致梯度消失;除以√dₖ可使方差稳定在 1(数学推导参考 Vaswani 论文)Transformer 如何加速推理?KV Cache 是什么?训练 vs 推理的并行性差异?→ 训练时所有 token 并行计算;推理时自回归,KV Cache 可缓存历史 K/V,避免重复计算,大幅提速多模态论文深挖(以 Video-LLaMA 为例)讲解 Video-LLaMA 的整体结构→ 视频编码器(如 ViT + Temporal Aggregator)→ 投影层(对齐文本空间)→ LLaMA 语言模型论文中 CoT(Chain-of-Thought)的具体设计?→ 在 prompt 中加入推理步骤示例(如 “视频中先看到人挥手,然后狗跑过来…”),引导模型分步作答微调 & 分布式训练微调用了 LoRA,介绍其原理→ 将权重更新 ΔW 分解为低秩矩阵 A×B,冻结原模型,只训练 A、B,大幅减少可训练参数LoRA 初始化怎么做?秩(rank)设为多少?为什么选这个值?→ A ~ N (0, σ²),B 初始化为 0;常用 rank=8 或 16,在效果和参数量间取得平衡(实验验证)知道 DeepSpeed 和 Megatron 吗?分别说说→ DeepSpeed(微软):主打 ZeRO 显存优化;Megatron-LM(NVIDIA):张量并行 + 流水线并行论文用 DeepSpeed,三个 Stage(ZeRO-1/2/3)分别是什么?→ Stage1:优化器状态分片;Stage2:+ 梯度分片;Stage3:+ 模型参数分片(通信换显存)二面下一篇再写吧,力竭了
查看10道真题和解析
点赞 评论 收藏
分享
评论
6
1
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务