荣耀大模型算法实习面经分享
给我面没招了,发点面经攒攒人品~
1. 项目拷打
2. 项目数据量一万多条具体指什么,数据格式
3. 为什么选用7B千问基座模型,而不选用更小尺寸的模型?
4. LoRA 微调时参数设置(r=16、alpha=32)的依据是什么?
5. 项目baseline是什么,如何证明微调有效?
6. 模型存在逻辑混乱、重复等问题,回头看可以做哪些改进?
7. 数据量仅1万条,模型容易产生幻觉,该如何解决?
8. 小模型容易出现复读机现象,有哪些方法可以改善?
9. 模型评估采用了哪些方式,人工评估+大模型裁判打分的具体逻辑是什么?
10 是否了解RAG,该法律问答项目是否适合使用RAG,为什么?
11 介绍KL散度的定义,其衡量的“偏差”具体指什么?
1. 项目拷打
2. 项目数据量一万多条具体指什么,数据格式
3. 为什么选用7B千问基座模型,而不选用更小尺寸的模型?
4. LoRA 微调时参数设置(r=16、alpha=32)的依据是什么?
5. 项目baseline是什么,如何证明微调有效?
6. 模型存在逻辑混乱、重复等问题,回头看可以做哪些改进?
7. 数据量仅1万条,模型容易产生幻觉,该如何解决?
8. 小模型容易出现复读机现象,有哪些方法可以改善?
9. 模型评估采用了哪些方式,人工评估+大模型裁判打分的具体逻辑是什么?
10 是否了解RAG,该法律问答项目是否适合使用RAG,为什么?
11 介绍KL散度的定义,其衡量的“偏差”具体指什么?
全部评论
相关推荐
查看24道真题和解析 点赞 评论 收藏
分享
