阿里夸克算法实习面经 攒人品

1.Lora 的相关八股:常见参数、缩放
2.有没有做记忆衰退,避免旧数据干扰新任务?
3.Deepspeed zero3为什么比zero2更省显存
4.训练大模型的框架都有哪些呢
5.讲解一下 Flash Attention
6.讲解一下 Qwen 的滑动窗口注意力机制,计算量是多少?
7.PPO 的损失函数构成。
8.讲解一下KL散度。PPO和GRPO的损失函数有哪些区别?
9.在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?
10.32B 模型全量微调 和Lora 微调的显存估算
11.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?
12. human feedback 是怎么被 agent 消化吸收的?
全部评论
实习都问的这么难嘛
点赞 回复 分享
发布于 01-19 18:08 江西
这问题密度,感觉有希望啊
点赞 回复 分享
发布于 01-10 21:39 北京
你这是日常实习?
点赞 回复 分享
发布于 01-10 17:30 陕西

相关推荐

04-08 20:41
门头沟学院 Java
1.自我介绍2.rag流程讲下3.基于什么框架搭建的4.ppt智能体怎么做的,是只是部署了吗;做了那部分流式,提示词约束,前后端联调5.分块策略讲下,为啥切分还要设置 固定字符6.为撒选择768维度7.讲下embeindg模型原理,transfomer原理;讲下decoder encoder面:本质上decoder就是一个embedding8 milvus原理BM25算法9.讲下欧式距离 内积 向量i相似度底层怎么计算的讲了内积,分解维度向量,点乘相加10.skill讲下渐进式纰漏,为撒大模型可以决定使用哪个答得意图识别,工具排名,然后选择上面的skill调用11.假设sse输出,前端突然关掉页面,后者服务宕机;并且传输的分片,需要长时间等待(LLM或者文生图这样的模型)(现在一起上传前端)提示网络层去做答得:中间件存储面:可以在网络层加心跳机制12.选择一个你擅长的点openclaw claude13claude的skill有哪些;14.你觉得claude有哪些可以拓展的点答得记忆和skill,和项目风格和上下文对齐15.function call mcp skill 调用有什么区别16.openclaw除了定时和skill还用过其他的功能吗17.用aicodeing多吗,用的什么模型;讲下aicoding思路,知道热更新机制的模块吗;glm5,中转节点先架构,python,必须简单运行,先写总体文档,列出要考虑生成环境的点9.2终端再分模块开发限制9-13min18.生产环境考虑的点kafka的一套,有序,幂等,消息丢失;并发;内存存储,服务宕机重启,数据丢失19.为啥要再生成一份项目交付md把需求md覆盖了,生成了个总结的文档主要拷打了底层微调也有问,和transfomer架构kqv和中间额层,和具体用哪个通用大模型的关系
查看27道真题和解析
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务