乐元素 AI推理研发工程师 社招 二面
半小时,主要是问项目,考察业务理解,方案解决思路,中间穿插项目涉及的知识点。
1. 自我介绍
2. 拷打项目,如何进行推理加速的,量化减少多少时间,剪枝减少多少时间。如何排查掉点问题,是如何想到走剪枝的方法,整个推理加速的思路。量化是什么,主要实现流程,主要量化方式有哪些,这些方法的区别。
3. 剪枝的流程(重要性参数微调,剪枝,精度恢复),数据集大小,如何分割,评估指标。
4. trt插件和核函数的实现方式,加速效果。nsys如何使用,排查推理瓶颈的思路。
5. 在线AI服务相关问题。
6. 反问,目前组内做内部的AI服务,三种方式,API(通过python,访问量大就扩容),SDK离线部署,APP/网页插件。
1. 自我介绍
2. 拷打项目,如何进行推理加速的,量化减少多少时间,剪枝减少多少时间。如何排查掉点问题,是如何想到走剪枝的方法,整个推理加速的思路。量化是什么,主要实现流程,主要量化方式有哪些,这些方法的区别。
3. 剪枝的流程(重要性参数微调,剪枝,精度恢复),数据集大小,如何分割,评估指标。
4. trt插件和核函数的实现方式,加速效果。nsys如何使用,排查推理瓶颈的思路。
5. 在线AI服务相关问题。
6. 反问,目前组内做内部的AI服务,三种方式,API(通过python,访问量大就扩容),SDK离线部署,APP/网页插件。
全部评论
相关推荐
点赞 评论 收藏
分享
08-17 15:54
临沂大学 Java 点赞 评论 收藏
分享