推荐大模型筋斗云五面

上来两道代码题:二叉树路径总和(是一道hard) 不限制路径起点 终点是根结点或者叶子结点,不能返回数量,要返回路径。第二道题是跳跃游戏的变体,动态规划,细节记不清出了,就是跳跃游戏变体,相对容易。
这俩代码写了二十多分钟,然后我以为代码考核结束了,结果问我八股文了,sigmoid写一下,bce loss写一下,为什么分类用bce不用mse,从梯度角度解释一下,公式推导
这些就过去四十多分钟了
后面又问了我ppo dpo区别 重要性采样是干嘛的 grpo和ppo区别,写一下ppo的loss 写一下dpo的loss
继续又问了我实习期间多模态embedding咋提取的,用的什么模型,了解多模态大模型不,qwen-vl啥的,架构是啥呢?
又问我grpo时候reward model咋训练的
又问了多模态赋能cvr,llm赋能cvr
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务