阿里淘天llm算法日常实习一面

攒人品中!
1.minimind数据集怎么来的?预训练数据集是什么形式的?为什么这样设计?
2.项目指标提升多少?
3.了解qlora吗?
4.dpo和grpo区别?项目指标上又有什么区别?数据上呢?
5.为什么要做强化学习?为什么不能直接把想要的直接加sft里面从而不用rl
6.moe介绍?架构?
7.多模态模型了解过吗?
8.了解dapo吗?
9.手撕moe
全部评论

相关推荐

昨天 15:23
江西农业大学 C++
csig 腾讯云 暑期一二面面经:一面 50min实习经历括号对是否合法反问二面 40min实现一个高并发高可用的消息队列来完成生产者消费者模型实习经历是的,你没看错。全程无八股。年前的字节、快手,到这次的藤子,一个八股都没问过。说实话有点不习惯,以前背得滚瓜烂熟的HashMap、线程池、JVM调优,一个都没用上。如果不涉密,我已经想开个班把实习经历卖出去了。目前的情况:腾讯、字节,两个应用部门都不问八股。下周准备挑战私募和创业厂,看看那边还背不背八股。---给正在准备面试的同学一点参考:1. 八股不是没用,但优先级在下降大厂应用部门更看重你实际做过什么、能不能讲清楚项目中的决策和踩坑。背题能过简历关,但过不了面试关。2. 实习经历是新的“八股”现在面试官喜欢问:“你当时为什么这么设计?”“有没有别的方案?”“如果流量翻十倍怎么办?”建议把实习中的每一个细节都准备好,尤其是矛盾点、取舍、复盘。3. 不同公司、不同部门差别很大有的组还喜欢拷打基础,有的组全程聊项目。面之前可以多看看该部门的面经风向,别只背通用八股。4. 如果遇到全程聊项目的面试官,恭喜你说明他真想看你能不能干活。这时候把项目讲得有逻辑、有数据、有反思,比背一百道题都管用。最后:不是八股彻底死了,而是面试正在变回“聊天”而不是“考试”。祝大家都能遇到聊得来的面试官。
查看3道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务