推理部署优化/高性能开发 春招总结-1

腾讯
    一面
        1. Tensorrt-LLM, AGI , VLLM源代码区别
        2. 为什么要有continue batch
        3. fastllm.cpp 的源代码
        4. yolo加速
        5. Python 计算密集型使用多进程还是多线程
        6. C++继承怎么实现的
        7. 最大子数组之和
    二面
        1. 求比特位中1个个数
        2. 编译时运行
        3. VLLM ,PageAttention
        4. Cuda 内存模型介绍
        5. 使用triton 实现 PageAttention
    二面挂#金三银四,你有感觉到吗#
#春招提前批,你开始投了吗#
全部评论
佬,面的啥部门呀
1
送花
回复 分享
发布于 04-02 00:17 广东
请问应该投什么岗位呢这个方向
1
送花
回复 分享
发布于 04-13 20:00 浙江
国泰君安
校招火热招聘中
官网直投
佬,triton实现pagedattention是手撕吗
点赞
送花
回复 分享
发布于 04-04 14:12 广东
mark
点赞
送花
回复 分享
发布于 04-15 21:56 湖北
大佬自学吗还是课题组方向
点赞
送花
回复 分享
发布于 04-28 08:48 黑龙江
mark
点赞
送花
回复 分享
发布于 05-07 21:13 湖南
mark
点赞
送花
回复 分享
发布于 05-07 21:13 湖南
大佬,这个岗位投递名字是啥啊
点赞
送花
回复 分享
发布于 06-02 15:36 湖北

相关推荐

头像
05-22 14:27
已编辑
门头沟学院 电子信息类
#牛客帮帮团来啦!有问必答#我在读研期间,一直在芯片公司做一些编译器或者推理加速相关的工作,做过模型压缩,算子融合,动态算子相关的一些工作,但是一直在做单机单卡上相关的工作,这是我的一些背景。去年大模型火了以后多了很多大模型的机会,我本来以为这个岗位需求量会很大,但是实际秋招的时候,很多芯片公司在这个方向上招人都是个位数,虽然也可以硬蹭互联网还有一些纯 AI 初创,但是招人也特别少,而且因为急着出成果,都希望招资深工程师,在初期别人大厂各种乱杀的时候,只有自动驾驶的一些公司给了一些机会,后来运气不错又拿了一些大厂做大模型推理团队的 offer ,目前在去苏州做 ADAS 类似嵌入式的工作和去上海做大模型推理之间摇摆,上海总包多将近 20 ,但是我还是有一些担心的点。1. 推理优化的手段真正有效的其实有限,每个公司在这个方向几乎只有十几人的小组在做,我不确定以后跳槽坑位是否足够。2. 现在大模型越来越火,入行的人的资历也越来越好,动辄系统方向的顶会,优秀的开源项目,反观我只有一些实习的经验,对比之下,感觉压力很大。3. 经历了芯片赛道的狂热到现在的业务收缩以后,曾经我也以为算力是基本,做芯片行业肯定能温饱不愁,现在持相反态度,我感觉大模型以后一定是个好方向,但是对于从业者却未必友好。而去外企做嵌入式就没啥太多想法了,苏州家里可以支持买房,可以生活的比较舒服,工资也算给的足够多,如果算上女朋友加起来收入和上海持平(因为女朋友在上海只有银行的选择收入比较低)。两边都有被裁风险,苏州这边做嵌入式的公司相对应该更多一点,缺点就是确实不太喜欢嵌入式,对汽车的软件开发也喜欢不起来,但是可以克服;而且也不一定稳定,加班也不怎么少。总之,感觉选哪边都会后悔,经历了一段时间的决策,包括家庭等因素进去,更加不知道如何选择,希望删繁就简,仅从方向和城市的角度请各位大佬给点意见。
也就平平无奇:直接选嵌入式,大模型或者说agi最后的落地也是要做成嵌入式的,现在聊天机器人也只是过渡,嵌入式未来不会变太差,考虑下家庭生活体验就苏州吧
点赞 评论 收藏
分享
4 42 评论
分享
牛客网
牛客企业服务