德赛西威 上海 模型部署工程师 一面
主要职责:模型加速推理和精度维护。负责智驾模型的部署,涉及模型量化、剪枝和蒸馏工作,部署平台nvidia、高通等芯片的车载智驾模块。
需要的技术栈:python, C++,onnx, tensorRT, CUDA写trt插件。
1.自我介绍
2.量化剪枝蒸馏是什么,主要如何实现,硬剪枝是什么意思。模型掉点如何排查。
3.项目内容,涉及CNN和VIT剪枝,主要是如何实现,达到什么效果,遇到什么困难,如何解决。
4.trt插件相关,主要实现的功能,有没有写过插件库。
后面直接打开leetcode,现场写,题号209和240.