27实习快手NLP算法面经分享
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习拷打
2.如何选择基座模型?有哪些因素需要权衡?
3.了解市面上有哪些中文的开闭源模型?
4.有哪些微调的方法?怎么判断做全参还是lora
5.有什么东西主要影响微调的效果?数据需要关注哪些点,多样性怎么做权衡,有一些长尾样本要怎么判断应不应该采样?对于prompt应该关注哪些方面?
6.怎么看待llm的复读和幻觉问题,如果微调过程中出现这类问题怎么处理?
7.sft做到什么程度可以做RL?
8.多模态大模型中用什么网络对齐图像和文字的embedding?除了ViT还有什么?
9.手撕:两数之和,三数之和
1.实习拷打
2.如何选择基座模型?有哪些因素需要权衡?
3.了解市面上有哪些中文的开闭源模型?
4.有哪些微调的方法?怎么判断做全参还是lora
5.有什么东西主要影响微调的效果?数据需要关注哪些点,多样性怎么做权衡,有一些长尾样本要怎么判断应不应该采样?对于prompt应该关注哪些方面?
6.怎么看待llm的复读和幻觉问题,如果微调过程中出现这类问题怎么处理?
7.sft做到什么程度可以做RL?
8.多模态大模型中用什么网络对齐图像和文字的embedding?除了ViT还有什么?
9.手撕:两数之和,三数之和
全部评论
sft到啥程度上RL 这题不好答
sft 数据量级大概多少
相关推荐
牛客92772631...:28届都要抢了嘛
查看24道真题和解析 点赞 评论 收藏
分享