荣耀大模型算法实习面经分享

给我面没招了,发点面经攒攒人品~
1. 项目拷打
2. 项目数据量一万多条具体指什么,数据格式
3. 为什么选用7B千问基座模型,而不选用更小尺寸的模型?
4. LoRA 微调时参数设置(r=16、alpha=32)的依据是什么?
5. 项目baseline是什么,如何证明微调有效?
6. 模型存在逻辑混乱、重复等问题,回头看可以做哪些改进?
7. 数据量仅1万条,模型容易产生幻觉,该如何解决?
8. 小模型容易出现复读机现象,有哪些方法可以改善?
9. 模型评估采用了哪些方式,人工评估+大模型裁判打分的具体逻辑是什么?
10 是否了解RAG,该法律问答项目是否适合使用RAG,为什么?
11  介绍KL散度的定义,其衡量的“偏差”具体指什么?
全部评论

相关推荐

评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务