阿里国际大模型算法-日常实习一面
攒人品中~~~
1.项目介绍
2.拷打实习
3.pagedattention解释 continuebatching解释
用了vllm加速后前后推理一致率怎么样
4.warmup为什么是前100步除了损失变化更快还有什么变化
5.大模型是什么结构 看过源码吗
6.为什么用这两个数据集 和你自己的数据 数据配比怎么样
7.多模任务和文本什么区别
8.拷打项目
9.解释redis和sql区别
10.解释bm25公式劣势如何改进
11.解释bge reranker精排别的精排方式有哪些12.模型是离线还是在线 和主流在线比谁更快
token输出速度是多少
13.解释评估中的ssim
14.手撕mha
1.项目介绍
2.拷打实习
3.pagedattention解释 continuebatching解释
用了vllm加速后前后推理一致率怎么样
4.warmup为什么是前100步除了损失变化更快还有什么变化
5.大模型是什么结构 看过源码吗
6.为什么用这两个数据集 和你自己的数据 数据配比怎么样
7.多模任务和文本什么区别
8.拷打项目
9.解释redis和sql区别
10.解释bm25公式劣势如何改进
11.解释bge reranker精排别的精排方式有哪些12.模型是离线还是在线 和主流在线比谁更快
token输出速度是多少
13.解释评估中的ssim
14.手撕mha
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV

感觉问的似乎还行啊
考虑我司不 欢迎联系
相关推荐
04-09 22:36
澳门大学 算法工程师 27暑期大李GOAT:今天二面的时候因为面试官问了场景题,但是那个场景题太容易了,一面就问过我类似的,一面面试官还耐心给我解答了,并且完全可以拿OpenClaw和Claude code的思路来套,我就说的很流畅被面试官质疑是不是拿AI搜的,然后我说最近面试比较多问的问题比较相似,只是换了场景,会不会凉啊😭
查看8道真题和解析 点赞 评论 收藏
分享