03-24 22:58 华东师范大学电子信息类

关注

上海人工智能实验室大模型算法实习面经

问的很细很深，狠狠拷打了80分钟，这个组做LLM pretrain的，我主要会rl，nlp缺乏点，一面凉

自我介绍
项目
微调模型训练数据来源？
LORA的理解
Ptuning和全量微调对比
RLHF全流程
写出RLHF的优化目标公式
目标公式中衰减因子的作用，取大取小有什么影响？
RLHF的目标公式可以加入什么其他的项？
熵正则项是如何加入的？
KL散度理解？
RLHF中PPO算比率相对什么来算？
其中对数概率的作用？
马尔科夫决策过程的定义，有哪些参数变量需要考虑？
Reward model 训练的loss是什么？
模型为什么会胡言乱语？根源在哪？可以考虑如何解决？
模型微调会性能下降为什么还需要这一步？
文本数据处理到进入模型的整个过程？
分词和向量化的过程？
模型微调过程中的调参？
1.8b和7b使用中的区别？选择？
Recall，Precision的计算
训练数据量级？
如何把控数据质量？
场景题，在处理数据的时候面对有违规的语料（如黄暴内容）如何平衡Recall，Precision指标
对大模型整个发展趋势如何理解？
你认为LLM的数据质量的关键在于什么？
算法题一，easy 考察正则表达式
算法题二，dp ，medium *********
算法题三，栈，easy **********

#大模型##LLM##算法##实习#

全部评论

推荐最新楼层

Xannal

Python

问的挺细节的

点赞回复

发布于 03-25 12:53 陕西

牛客564743932号

合肥市六安路小学计算机类

哥们是博士还是硕士

点赞回复

发布于 03-25 15:27 安徽

联易融

校招火热招聘中

官网直投

牛客200453047号

香港大学电子信息类

在哪投递呢

点赞回复

发布于 03-26 14:35 香港

JunYuCoding

深圳大学计算机类

这么细节

直接寄啊

点赞回复

发布于 03-30 00:33 广东

拥抱太阳的芝士很忙碌

北京邮电大学设计学类

也太细了...

点赞回复

发布于 04-08 10:47 北京

在刷题的马后炮炮手很饥饿

门头沟学院

佬，请问二面了吗

点赞回复

发布于 04-10 09:13 江苏

Aaroe

石家庄市第一职业中专学校水产类

佬有二面吗

点赞回复

发布于 04-16 14:38 北京

Devs008

04-09 17:25

已编辑

东北大学计算机类

oppo 多模态大模型算法实习一面面经

这个是之前某B开头软件上投的，官网投oppo一直没消息全程50多分钟1.自我介绍2.拷问第一个项目，我说是论文的项目，然后面试官直接让我共享屏幕打开论文，从模型结构开始讲了😭每块都问，问得很细，大概三十分钟3.拷问第二个项目，先让我介绍一下，我从数据获取、向量库检索、lora微调、幻觉缓解介绍；然后他开始提问重要的点，由于之前的面试让我有了防备，我发现他们都喜欢问两个点，第一个是数据构建的时候爬虫爬到成段的数据怎么处理，我说先基于语义感知的模型进行切分，再基于chatgpt构建问答；第二个是向量检索时检索到错误或者无关的怎么办，我就说设置了检索匹配的阈值，高于阈值才算成功检索4.问我linux下的命令熟悉吗，我说熟悉，殊不知挖坑了😭然后开始问我json处理的命令、shell的命令，我都不会，难崩5.反问，问了部门做什么业务，然后面试官大概讲了一下多模态对话相关的，我表示很感兴趣6.到岗时间、实习几个月，我直接祖传话术八股还是融在项目里，没有算法题，但是拷打五十分钟不轻松，我还以为oppo会轻松点😭————————————————————更新一下，一面完当天就oc了 #实习#  #算法#  #面试中的破防瞬间#  #实习，投递多份简历没人回复怎么办#  #简历被挂麻了，求建议# #软件开发2024笔面经#

面试中的破防瞬间实习，投递多份简历没人回复怎么办

点赞评论收藏

纠结的牛牛在看面经

04-10 11:58

电子科技大学电子信息类

百度算法实习面经

1.自我介绍 2.深问项目 3.大模型出现幻觉的原因，及对应的解决方法 4.做题（二叉树的层次遍历）

点赞评论收藏

我也是找不到实习的摆子

04-07 12:22

北京大学计算机类

【25暑期实习】Soul大模型一面

面试时长40分钟自由交流15分钟面试官小姐姐超超超超温柔1. 自我介绍2. 问大模型实习项目，做了什么，用了什么开源模型，主要是chatglm和llama3. 有没有尝试过改原模型的设计，比如结构或者loss函数？为什么不？3. 说一下chatglm或llama与传统transformer结构的区别，有哪些改动，和可以借鉴的地方？主要从模型结构、layer norm、激活方式、位置编码回答4. 在实际训练或微调的过程中遇到了哪些问题，是怎么解决的？主要讨论了下精度问题、梯度爆炸、loss出现nan5. 说说bf16、fp16、fp32的区别6. 简单讲了下deepspeed7. 微调的话用了哪些方法？讲主要是lora8. 追问了下我们用lora调哪些参数？不同参数怎么选？什么影响？……想不起来了一部分7. 代码实现transformer原来的sinusoidal位置编码团队介绍主要做的产品是Soul X系列目前算法组将近100个人，其中NLP组不到20个人，目前主要工作在Role Play方向，AI狼人杀也在其中。国内海外都有相关产品，业务赚钱为主，发专利为辅，有发专利的Okr，没发过论文，但有往技术自研转型的趋势。资源方面的话H800，不到100张。

点赞评论收藏

CV的小研究生

04-11 10:06

西南技术物理研究所电子信息类

虾皮shoppe计算机视觉/多模态面经

一面问项目，手撕self- attention二面待更新估计凉了，一面做出来的时间有点久

虾皮信息二面12人在聊

点赞评论收藏

10 77 评论

招聘动态

滴滴

2025届秋招储备实习生招聘

联易融2024届营销管培生校园招聘

全站热榜

正在热议

# 你更愿意参加线上面试还是线下面试？ #