腾讯TEG-AI平台部-技术研究日常二面

1.面试之前先问有什么想了解的,我问了需要实习生什么特质,是过程能力多还是业务理解多?回答都需要
2.问了能实习多久,多久到
3.现在实习的内容是什么?你负责什么工作?
4.R1复现数据问题?怎么做的?GRPO奖励函数设置?你遇到最大的麻烦?用的什么框架?GRPO如果是在代码或者数学场景表现比较好,那如果切换成一些图片生成场景,你有什么方法去解决呢?
5.手机助手项目数据?怎么做的?你做了哪些工作?长链路和短链路有什么差异表现?PPO和GRPO区别?看你写了了解DAPO,讲一下。提升的指标分别是哪些?讲一下具体含义。
6.场景题:如果让你去建一个知识库啥的,会怎么做?还好看过GraphRAG和LightRAG,给面试官讲了两个东西
7.代码题灯泡开关
8.平时用哪些大模型或者AI工具,用来干啥?说一下最近很火的OpenClaw#27届实习投递记录#
其实现在看来当时好多问题没答上来,要是暑期的强度肯定直接挂了,结果还是泡到最后挂的,现在让我来面肯定能过了
全部评论
PDD考虑吗,agent研发急招人,帮跟踪进度:https://careers.pddglobalhr.com/campus/intern?t=47LjBxZ34k
点赞 回复 分享
发布于 04-10 10:46 上海

相关推荐

3月初面的,当时暑期没开面试官开始先做了部门介绍,以及业务内容,需要实习6个月以上1.R1复现方案,奖励函数为什么这么设置?有考虑过数据泄露的情况吗,就是如果你改的这些题目比较相似的话?有没有出现中英混答的情况?怎么解决?为什么你的最后结果没有突破到更高的分数?你说你用的Kimi K2和Gemini,是什么形式的?API还是网页?如果说不是输出你的奖励词语,也是可以做到推理的,你怎么考虑这个问题?2.手机助手项目拷打:介绍背景,怎么做的。如果我现在的场景是APP更新之后,点击的模块发生变化,你会怎么解决这个问题?如果是上下滑动找商品呢?3.GRPO如果组内设置的size非常小的话会怎么样?4.GRPO的平均是怎么计算的?5.场景题:如果让你来搭建一个LOL的陪玩助手,你会怎么搭建?(这里我没明白这个助手是要当辅助这种还是就一个语音助手就行了,面试官说语音的助手就行了)可以从数据选择,整个架构设计来说。如果用户发现你的这个助手语气太生硬了,你怎样解决?如果版本更新,装备这些东西变了,你是训练到模型里面去的,模型需要重新训练吗?有没有什么解决办法?如果是LOL你在对线的时候,发生了小龙团,你怎么样让助手去做这种场景的一个提醒规划?6.有了解过MOE模型吗?主包只记得激活参数小很多😭7.讲下PPO8.LoRA原理,AB矩阵初始化9.MCP和Skills有了解吗?10.代码:先写打家劫舍,然后改进输出具体打劫了哪些11.多久能到岗?能实习多久?导师那边没问题吗?12.反问:HC?有,需要和暑期同学竞争
查看11道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务