上海人工智能实验室大模型算法实习面经

问的很细很深,狠狠拷打了80分钟,这个组做LLM pretrain的,我主要会rl,nlp缺乏点,一面凉

  • 自我介绍
  • 项目
  • 微调模型训练数据来源?
  • LORA的理解
  • Ptuning和全量微调对比
  • RLHF全流程
  • 写出RLHF的优化目标公式
  • 目标公式中衰减因子的作用,取大取小有什么影响?
  • RLHF的目标公式可以加入什么其他的项?
  • 熵正则项是如何加入的?
  • KL散度理解?
  • RLHF中PPO算比率相对什么来算?
  • 其中对数概率的作用?
  • 马尔科夫决策过程的定义,有哪些参数变量需要考虑?
  • Reward model 训练的loss是什么?
  • 模型为什么会胡言乱语?根源在哪?可以考虑如何解决?
  • 模型微调会性能下降为什么还需要这一步?
  • 文本数据处理到进入模型的整个过程?
  • 分词和向量化的过程?
  • 模型微调过程中的调参?
  • 1.8b和7b使用中的区别?选择?
  • Recall,Precision的计算
  • 训练数据量级?
  • 如何把控数据质量?
  • 场景题,在处理数据的时候面对有违规的语料(如黄暴内容)如何平衡Recall,Precision指标
  • 对大模型整个发展趋势如何理解?
  • 你认为LLM的数据质量的关键在于什么?
  • 算法题一,easy 考察正则表达式
  • 算法题二,dp ,medium *********
  • 算法题三,栈,easy **********
#大模型##LLM##算法##实习#
全部评论
问的挺细节的
点赞 回复
分享
发布于 03-25 12:53 陕西
哥们是博士还是硕士
点赞 回复
分享
发布于 03-25 15:27 安徽
联易融
校招火热招聘中
官网直投
在哪投递呢
点赞 回复
分享
发布于 03-26 14:35 香港
这么细节 直接寄啊
点赞 回复
分享
发布于 03-30 00:33 广东
也太细了...
点赞 回复
分享
发布于 04-08 10:47 北京
佬,请问二面了吗
点赞 回复
分享
发布于 04-10 09:13 江苏
佬有二面吗
点赞 回复
分享
发布于 04-16 14:38 北京

相关推荐

头像
04-09 17:25
已编辑
东北大学 计算机类
这个是之前某B开头软件上投的,官网投oppo一直没消息全程50多分钟1.自我介绍2.拷问第一个项目,我说是论文的项目,然后面试官直接让我共享屏幕打开论文,从模型结构开始讲了😭每块都问,问得很细,大概三十分钟3.拷问第二个项目,先让我介绍一下,我从数据获取、向量库检索、lora微调、幻觉缓解介绍;然后他开始提问重要的点,由于之前的面试让我有了防备,我发现他们都喜欢问两个点,第一个是数据构建的时候爬虫爬到成段的数据怎么处理,我说先基于语义感知的模型进行切分,再基于chatgpt构建问答;第二个是向量检索时检索到错误或者无关的怎么办,我就说设置了检索匹配的阈值,高于阈值才算成功检索4.问我linux下的命令熟悉吗,我说熟悉,殊不知挖坑了😭然后开始问我json处理的命令、shell的命令,我都不会,难崩5.反问,问了部门做什么业务,然后面试官大概讲了一下多模态对话相关的,我表示很感兴趣6.到岗时间、实习几个月,我直接祖传话术八股还是融在项目里,没有算法题,但是拷打五十分钟不轻松,我还以为oppo会轻松点😭————————————————————更新一下,一面完当天就oc了 #实习#  #算法#  #面试中的破防瞬间#  #实习,投递多份简历没人回复怎么办#  #简历被挂麻了,求建议# #软件开发2024笔面经#
点赞 评论 收藏
转发
10 77 评论
分享
牛客网
牛客企业服务