5.29 淘天大模型应用实习生(50min)

1.自我介绍
2.IOT场景是什么场景,介绍是米家场景,用LLM效果会比较好
3.之前线上用的推荐模型是什么
4.基座模型最后用的是什么,Qwen2.5用Qlora微调时没有出现过拟合情况吗×
5.训练的框架用的是什么×
6.Qwen2.5的框架,GQA,Decoder-only,RMSNorm,位置编码动态
7.Qwen2.5用的是Dense还是Moe×,回答Dense
8.如果用LLM来做分类,用encoder做还是decoder做会好一点×,回答encoder
用Bert做分类的话softmax加在哪一层,加在哪一个维度?×
9.LLM用在推荐系统上,怎么用,用户的历史数据为亿级×回答做不了端到端,但可以做召回和精排
10.LLM适不适合用来做embedding生成?encoder架构还是decoder架构适合?那为什么还要用decoder-only的Qwen来做encoder?
11手撕MOE或LORA
全部评论

相关推荐

完美的潜伏者许愿简历...:隐藏信息被你提取出来了,暗示,这就是暗示
点赞 评论 收藏
分享
能干的三文鱼刷了10...:公司可能有弄嵌入式需要会画pcb的需求,而且pcb能快速直观看出一个人某方面的实力。看看是否有面试资格。问你问题也能ai出来,pcb这东西能作假概率不高
点赞 评论 收藏
分享
07-02 13:52
门头沟学院 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务