一面 10.10日 1.5h(一面挺难,像cto)自我介绍,讲一下大模型应用项目(我讲的nl2sql的项目)项目背景,总体思路,解决什么问题,指标是什么细节拆分:1.数据集怎么构建的,什么规模,有没有质量评估2.模型底座是什么,这些不同底座什么区别,什么规模3.训练方法,用的什么sft,有什么不同,有什么优缺点,原理上解释不不同方法的差别4.评估指标是什么,这些指标存在哪些问题5.模型推理是怎么做的,有没有cot,tot等等,还是单轮6.模型可控性如何实现,怎么保证可控性7.模型部署的平台,推理效率怎么样,如何提升推理效率8.有没有上线,面临什么问题,怎么解决9.给一个总的输入输出样例,每一步包含什么prompt,多轮推理每一步输出什么结果,模拟一下,数据集格式是否要调整成这样,数据形式是什么,怎么拆分成多轮形式等等。。到这里项目差不多了大概问了45min然后是八股+开放式问题1.大模型前景2.大模型主要存在的问题和解决思路(幻觉,定向编辑,继续训练等等)3.大模型加速框架了解多少,知不知道原理 如何进行加速优化4.为什么要用大模型做传统结构化解析任务 你对用大模型做这些事有什么看法到这差不多1小时最后是能不能实习,对最新的研究了解多少,看过多少最新论文等等我本以为结束了,但是,最后我们来做一道题吧题我忘了,好像是一个迭代法求根的题,反正当时已经神志不清了,好像没ac2.二面10.13日 45min很简单,感觉是部门leader,简单问了问项目,普通八股,大模型上线会有什么问题,占用多少资源,怎么优化等等,比一面简单太多
点赞 30
评论 10
全部评论

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务