投的岗位比较杂,主要是NLP,也包括一些多模态、大模型、推荐相关的岗位,最终拿到了腾讯、顺丰、平安金服和迪子的offer,华子、京东和百度的池子。总结一下,首先算法的问题会问得非常杂,主要根据你的项目经历,面试官一般会从你的经历里挑和他们工作内容比较相关的点提问,然后不断扩展;反而八股文问的不多,一般是一些中小厂喜欢问八股。最后是自己的一点见解,对于非研究性质的算法岗位,论文的权重并没有很大(也看面试官的喜好),反而是相关的竞赛/实习经历会非常重要。有意找算法岗的uu,一定要去搜广推(可以再加一个大模型)相关的岗位刷刷实习经历。以下是整个秋招的面经:    用语言介绍一下Transformer的整体流程        深度学习的三种并行方式:数据并行,模型并行,流水线并行    Deepspeed分布式训练的了解,zero 0-3的了解。    对于CLIP的了解    说几种对比学习的损失函数,以及它们的特点和优缺点    说说大模型生成采样的几种方式,它们的特点和优缺点比较    损失函数中温度的作用    BLIP的细节。(面试中提的问题是BLIP为什么将训练分成两个阶段)    Visual Encoder有哪些常见的类型?    深度学习中常用的优化器有哪些?    SimCSE的了解    prenorm和postnorm    LLaMA 2的创新/ChatGLM的创新点/Qwen的创新点/Baichuan的创新点    LLM的评估方式有哪些?特点是什么?(中文的呢?)    文本生成模型中生成参数的作用(temperature,top p, top k,num beams)    LoRA的作用和原理    CoT的作用    神经网络经典的激活函数以及它们的优缺点    softmax函数求导的推导    BERT的参数量如何计算?    AUC和ROC    batch norm和layer norm    大模型训练的超参数设置    经典的词向量模型有哪些?    InstructGPT三个阶段的训练过程,用语言描述出来(过程,损失函数)    大模型推理加速的方法    Transformer中注意力的作用是什么    RNN、CNN和Transformer的比较(复杂度,特点,适用范围etc)    AC自动机    产生梯度消失问题的原因有哪些?    大模型的幻觉问题    大模型训练数据处理    RLHF的计算细节    构建CoT样本的时候,怎么保证覆盖不同的场景?    召回的三个指标:Recall、NDCG、RMSE    RoPE和ALiBi    交叉熵、NCE和InfoNCE的区别和联系    贝叶斯学派和概率学派的区别    一个文件的大小超过了主存容量,如何对这个文件进行排序?应该使用什么算法?    Python中的线程、进程和协程    python中的生成器和迭代器
点赞 49
评论 9
全部评论

相关推荐

小时候觉得老师是很伟大的职业 感觉老师都是人中龙凤才能当 后来考入大学 发现以前的老同学也是公费师范生了 他们什么样什么人品 我还不清楚吗 只能希望他们以后也会有改变 要不纯属耽误孩子 实习之后发现 有的领导 能当上领导也可能运气成分很多 自己决策方面很差 分配给属下的东西自己也说不明白  前些年那些明星 各种塌房 少林寺大师都能有情人和孩子 越长大越发现世界就是个草台班子 以前对不懂的东西有一层羡慕的滤镜 接触之后发现就不是那回事了
RazerYang:其实也是幸存者偏差,你只关注草台班子的部分,所以觉得世界都是草台班子。实际上你每天能安全地从床上醒来,有稳定的天然气、自来水和电力供应,能让你吃上热乎的饭菜,能收到持续稳定的信号去刷手机,花几块钱就能坐地铁从城市的一端快速移动到另一端,花几百块就能在一天之内安全穿越整个国家,这都不是一个草台班子能实现的。燃气、水利、电力、通信、公交、民航,还有最重要的公安和国防,这些都不是草台班子能做的,有无数普通人构筑了你生活的方方面面,而你也将加入他们。
我对___祛魅了
点赞 评论 收藏
分享
zzzzhz:兄弟你先猛猛投简历至少三百家,能约到面试就去面。最近可以速成智能小车,智慧家居烂大街的项目,不需要自己写,只需要把里面的代码讲解看明白就行。把其中涉及到的八股文都拿出来单独背一下,我去年找工作就一个智能小车智慧家居找了10k差不多。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务