腾讯pcg 三面 总监面 多模态(已oc)

自我介绍

项目

deepspeed zero 的三个状态?

1b 的模型需要多少显存?16G。模型2g,梯度2g,优化器状态4g+4g(以adam为例,一阶动量32位和二阶动量32位)。如果有32位的模型参数的备份,就还有4g。一共2+2+4+4+4=16g。

adam 优化器的形式?

Adam优化器中:

  • 一阶矩估计:用于引入动量,使参数更新具有“惯性”,加速收敛,同时平滑梯度,减少噪声影响,让参数更新更稳定。
  • 二阶矩估计:通过衡量梯度方差,自适应调整各参数维度的学习率,使不同维度都能以合适速度更新,还能有效处理稀疏梯度问题。

dpo ppo grpo的区别?

为什么用llava 不用qwen-vl?

在图文检索任务中,对CLIP细粒度问题和词序问题的看法,可以怎么解决这个问题?分别从模型和数据层面来解决。

clip对比学习的方式导致了对词序和组合词不敏感,个人认为clip无法解决这个问题,只能结合llm,利用改成多阶段用clip + mllm去做。

做题

最大子数组和。

反问:

领导更看重新人的哪些特质?

责任心和自驱力(卷王赢麻了)。

还提到了大模型时代,很多问题其实都有解决的方案(相比于搜索引擎时代),就看个人是否有决心完成任务。

腾讯实习生有机会接触到核心业务吗?

可以,不会特别区分对待实习生。

怎么看待大模型,会不会代替掉算法工程师?

当然,要不断学习,但是不用过度担心,大模型也不是万能的。

面试官看着很年轻,也很能聊。

感觉还可以,80%概率进hr面

全部评论
感谢分享,请问是 pcg 什么业务的呀
点赞 回复 分享
发布于 05-06 02:55 浙江
请问有一面二面的面经嘛?
点赞 回复 分享
发布于 04-09 11:58 陕西
已进hr面
点赞 回复 分享
发布于 04-07 19:56 北京
请问这是总监面吗,总监也考察代码吗
点赞 回复 分享
发布于 04-03 21:45 湖北

相关推荐

快乐的打工人求off...:GC回收主要是针对虚拟机中的堆中的对象,堆分为两部分,新生代和老年代,对新生代的垃圾回收称为minorGC,发生较为频繁,对老年代的GC称为majorGC,发生次数少但代价高;在GC开始之前,需要先标记出垃圾,一般有2种方法,引用计数法和可达性分析法;标记出对象之后需要进行垃圾回收,包括标记-清除算法,复制算法,标记-整理算法和分代回收算法。
查看6道真题和解析
点赞 评论 收藏
分享
地狱难度😭楼主四月中左右开始做这方面的准备,非计科的,学校里数据结构一点没学过,刷了半个月左右的力扣加八股,面了一个月左右,已成耐面王字节:两次一面挂😭(然后说我面评还不错还要捞我,被我拒了,感觉面了也是没戏)快手:4.11一面 4.25二面 5.9三面 横向挂(挂的时候还鞭我尸,挂完之后说再让我等等,老师们要再讨论一下,讨论完还是给我挂了😡)腾讯:wxg:4.25一面,过了约节后二面,结果节后没算法hc了(被26届的抢了),只有开发hc了,我说算了不搞开发5.15被wxg安全捞了,约了16号面试,结果面试前一小时取消,也是hc被26届抢没了😭5.20被IEG捞了,5.22一面,5.23二面,5.27三面,5.30四面,6.13offer(已拒)华为:笔试免,5.29测评,测评完约了5.29技术交流,约了6.5一面,拒了(华为的HR真的特别特别好,我当时已经收到网易oc了,说不想参与后续面试了,HR说那边可以尽快推进流程,还可以每次面试都告诉我结果,只要过了直接oc,相当于提前给口头offer,下次一定选华为😭,真的是我见过最好的HR姐姐)网易伏羲:5.19一面,5.20二面,5.26三面,5.28 oc,6.3 offer(已接)---入职一周了,组里氛围特别好,mt人也特别好,不卷时长,但工作时大家都很高效(早10晚6点半还有两小时午休,我入职第二天九点半到,发现部门一个人都没有我就知道我来对了😋)
我的OC时间线
点赞 评论 收藏
分享
评论
6
18
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务