蚂蚁集团-财保-招转正实习 大模型系统工程师

职位描述
1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统。主要职责包括AI系统结构设计,大模型训练数据构建,大模型能力评测,大模型推理效果和效率优化等;
2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型等AI技术创新应用与落地。

职位要求
1.计算机或数学相关专业的硕士或博士,发表过计算机领域、数学领域相关顶会论文者优先;在顶级计算机竞赛、或计算机榜单成绩优异者优先;
2.有优秀的代码开发能力,精通Python、Java、C++等至少一门编程语言;熟悉研发流程,扎实掌握计算机原理、数据结构、IO、线程/进程等原理及研发技能;
3.熟悉开源推理加速框架,如vLLM/sglang/TGI/DeepSpeed/LightLLM/TensorRT等,参与社区开源推理框架研发、在推理性能优化有发表论文优先;
4.深入理解深度学习原理和常见的神经网络架构,熟悉大规模语言模型的原理,掌握模型剪枝、量化、蒸馏的常见方法;
5.对大模型为代表的AI技术有浓厚兴趣,并对AI前沿技术有较敏锐的洞察力,熟悉前沿大语言模型或多模态大模型技术;
6.良好的表达能力,团队合作能力,能和团队一起探索新技术及业务应用。

欢迎私信我
全部评论
已老实
点赞 回复 分享
发布于 2025-05-13 16:39 安徽

相关推荐

04-10 09:55
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.你现在主要使用的开发语言有哪些?2.有使用过Java吗,对Java的掌握程度怎么样?3.Python里面的init_(和_new_)有什么区别?4.了解带有下划线的_new_方法吗?5.Python里面传参是传值还是传引用?6.如果对参数传入一个字符串类型,如何在方法内部修改它并把这个字符串的值传递出来?7.any和or有什么区别?8.Python里面有哪些元素最终判断为 False?9.Python里面的copy(浅拷贝)跟deepcopy(深拷贝)有什么区别?10.Python里面的垃圾回收机制是怎么样的?11.怎么去提高一个Python文件的运行效率?在编译层面还可以怎么做?12.Python里面会出现内存泄漏吗?13.怎么理解内存泄漏?全局变量算内存泄漏吗?14.如果把列表(List)本身作为一、二级缓存来使用,算内存泄漏吗?15.在操作系统方面,进程跟线程有什么区别?16.引入线程主要是为了解决什么样的问题?17.从浏览器里面输入一个URL,到整个页面的展示,中间的过程是怎样的?18.DNS解析用的是TCP还是UDP?19.TCP是几次握手、几次挥手?20.四次挥手有可能会变成三次吗(出现三个报文的情况)?21.什么是对称加密跟非对称加密?22.HTTP请求中GET和POST有什么区别?23.GET的长度限制是哪里限制的?是客户端还是服务端的限制?24.有用过哪些AI相关的编程工具?25.你觉得这些AI工具会代替掉现有的程序员吗?26.AI在哪些方面会比程序员要强?
查看26道真题和解析
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务