实习+项目:1. 详细介绍项目背景 结合业务场景2. 生成的训练数据,具体是怎么生成的?3. 数据增强是怎么做的?4. 怎么确保更大更复杂模型的结果,是100%正确的? 有没有量化指标可以确认5. 怎么样确保,把工具调用的轨迹 ,融入到种子数据集里面, promot是怎么设计的6. 除了lora以外 ,还了解其它的一些微调方法吗?7. 为什么lora的微调效果比较好?8. 切分策略是什么?9. 语义切分策略和固定大小切块分割策略,效果对比. 有哪些不一样的方面?八股:1. transformer的原理2. attention的公式3. 为什么除以根号dk算法:字符串解码面试回答的并不好,算法题未a出来。还是要好好沉淀