safe_86 level
获赞
5
粉丝
1
关注
0
看过 TA
26
门头沟学院
2027
算法工程师
IP属地:长沙
暂未填写个人简介
私信
关注
发一下问题给大家参考,攒攒人品!1. 实习拷打2. 你做的 Agent 系统采用的是什么框架?3. 系统的整体工作流 / 执行范式是如何设计的?4. 多路召回后的粗排策略是什么?5. 二阶段重排序(Rerank)是如何实现的?6. 多模态特征(图文)是如何融合的?7. 项目中使用了多大参数的模型?为什么这样选择?8. SFT 的训练目标是什么?数据集如何构建?9. VQA 数据的 Query 和 Answer 是如何生成的?10. 工具调用的监督数据(GT)是如何获取的?11. 数据生成后有没有做校验与过滤?怎么做的?12. LoRA 微调的超参数(rank)如何选择?13. 是否尝试过多种微调 / 强化学习方法?为什么选当前方案?14. 奖励函数(Reward)是如何设计的?15. 强化学习是优化端到端结果,还是优化单步决策?16. 有没有遇到奖励作弊(Reward Hacking)?如何解决?17. GRPO 的重要性采样的数学意义是什么?18. KL 散度系数等超参数是如何调优的?19. 多轮任务是否考虑端到端训练?如何设计?20. 模型 / 系统效果如何评估?指标怎么计算?21. 复杂查询 / 多意图查询如何做准确率评估?22. 系统推理延迟(首 Token 延迟)大概多少?23. 影响系统性能的主要因素有哪些?24. 请写出 Attention 计算公式,并解释原理。25. QK^T 为什么要除以根号 dk?
查看24道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务