大模型研发专家/架构
40-70K * 16薪
C++ 上海 本科 3-5年 3 个工作日内

岗位关键词
岗位职责
职位描述
负责***搜索引擎架构演进以及大模型训练及推理能力迭代,主要解决大规模数据下的分布式计算及在线引擎能力,支撑了全站的主要订单成交。
1. 参与生成式模型相关的大规模分布式机器学习平台的架构设计和构建,基于异构硬件,设计训练、推理方案,提升模型性能。
2. 参与开发基于生成式模型的算法在实际业务场景中的工程架构设计,提高系统的智能化水平。
3. 参与大规模数据处理的离线训练和在线推理,提升模型预测的准确性和实时性,推动数据驱动决策。
4. 参与数据工程相关工作,包括样本构建,特征数据清洗,开发维护稳定的在离线特征数据平台。
5. 持续关注领域内先进的技术和理论,参与技术分享与交流,推动团队技术能力的提升。
岗位要求
职位要求
1. 计算机相关专业本科及以上学历,具有扎实的算法基础,熟悉生成式模型及其实现,尤其是Transformer架构。
2. 3年及以上相关工作经验,在机器学习、深度学习领域有实际项目经验,熟悉常用的机器学习框架(如TensorFlow、PyTorch、vLLM等)。
3. 具备良好的编程能力,熟练掌握C++/Python者优先,有编写高质量代码和优化算法的能力。
4. 具备良好的计算机体系结构知识,理解异构GPU硬件的工作原理,了解异构计算(CUDA)
5. 熟悉大数据处理平台(如Hadoop、Spark等),具备数据工程相关知识,能够有效处理大规模数据。
6. 具备良好的沟通能力和团队合作精神,对新技术充满热情,具备强烈的责任感和学习能力。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报