日常实习蔚来大模型算法面经

1.实习项目介绍
2.项目具体内容
1.分块,如何写入
2.embedding维度(老师说1024不具有性价比512就够了)
3.数据库索引是什么?(我用的默认的)
4.为什么做rlhf?
5.rag的评价指标
3 八股(强化学习问的很细)
1.dpo、ppo、grpo
2.价值模型和奖励模型的区别
3.奖励需要可微吗(不需要,在强化过程中奖励模型不改变)
4.对于 ppo来说什么是 action,整个输出叫什么?
4代码题
手撕tokenizer不会,给我换了个leetcode的反转链表
全部评论

相关推荐

04-22 10:34
已编辑
门头沟学院 Java
base上海 岗位是工具链云平台全栈开发实习生大概面了一个小时左右 前后端以及ai都有涉及后端:用户点击下单后,库存是什么时候扣的?下单和支付分别处于什么阶段?是不是在用户还没支付时就先扣掉库存了?如果有人恶意下单、不付款、不取消,会不会长期占用库存?你怎么处理库存释放问题?你们为什么用 Kafka,为什么不用 RabbitMQ 或其他更轻量的 MQ,你理解里 Kafka 和 RabbitMQ 的最大区别是什么?什么是缓存击穿、穿透?布隆过滤器的作用是什么、底层结构是什么、大小一般怎么设置,布隆过滤器大小和商品量 、用户量、 订单量有什么关系?在 Spring Boot 启动完成后,如果想自动做缓存预热,怎么实现,怎么监听容器启动完成这个事件?Java 线程池一般用哪个类、在 Spring Boot 里怎么配置线程池?配完线程池后,线程会不会立刻创建?没有任务后线程是否一直保留?常用 Linux 命令、git命令前端:你的前端是自学的,还是在项目里真实做过?为什么学 Vue,没学 React?你对 Vue / Vue3 了解深不深?Vue3 生命周期有哪些?除了 Element UI 还用过哪些组件库?你知不知道栅格系统?什么是响应式单页面?ai闲聊 20分钟职业规划闲聊10分钟
查看18道真题和解析
点赞 评论 收藏
分享
评论
3
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务