推荐大模型筋斗云五面
上来两道代码题:二叉树路径总和(是一道hard) 不限制路径起点 终点是根结点或者叶子结点,不能返回数量,要返回路径。第二道题是跳跃游戏的变体,动态规划,细节记不清出了,就是跳跃游戏变体,相对容易。
这俩代码写了二十多分钟,然后我以为代码考核结束了,结果问我八股文了,sigmoid写一下,bce loss写一下,为什么分类用bce不用mse,从梯度角度解释一下,公式推导
这些就过去四十多分钟了
后面又问了我ppo dpo区别 重要性采样是干嘛的 grpo和ppo区别,写一下ppo的loss 写一下dpo的loss
继续又问了我实习期间多模态embedding咋提取的,用的什么模型,了解多模态大模型不,qwen-vl啥的,架构是啥呢?
又问我grpo时候reward model咋训练的
又问了多模态赋能cvr,llm赋能cvr
        这俩代码写了二十多分钟,然后我以为代码考核结束了,结果问我八股文了,sigmoid写一下,bce loss写一下,为什么分类用bce不用mse,从梯度角度解释一下,公式推导
这些就过去四十多分钟了
后面又问了我ppo dpo区别 重要性采样是干嘛的 grpo和ppo区别,写一下ppo的loss 写一下dpo的loss
继续又问了我实习期间多模态embedding咋提取的,用的什么模型,了解多模态大模型不,qwen-vl啥的,架构是啥呢?
又问我grpo时候reward model咋训练的
又问了多模态赋能cvr,llm赋能cvr
全部评论 
 相关推荐
10-27 18:08
  湖南第一师范学院第一附属小学 Java   点赞 评论 收藏   
分享
 10-29 10:09
  河海大学 Java   点赞 评论 收藏   
分享
  投递京东等公司10个岗位
投递京东等公司10个岗位 查看13道真题和解析
查看13道真题和解析 阿里巴巴公司氛围 653人发布
阿里巴巴公司氛围 653人发布