大模型反欺诈/风控算法实习生
390-400元/天
反欺诈/风控算法 上海 本科 4天/周 最少3个月

岗位关键词
岗位职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:穿山甲是全球开发者成长平台,依托巨量引擎的技术和产品能力,为开发者提供用户增长、流量变现、LTV提升等全生命周期的服务和成长方案。目前,穿山甲覆盖活跃DAU超过8亿,日均广告请求量超过630亿,日均广告展示量超过110亿,帮助超过10万个app在平台内飞速成长,也为超过10.5万广告主提供了用户增长和投放解决方案。
1、参与广告反作弊大模型的全流程训练,具体包括:
1)预训练: 基于海量广告作弊相关数据,优化反作弊专业领域自适应预训练策略,让大模型具备广告反作弊领域相关的基础知识;
2)指令微调 : 构建反作弊场景的指令数据集,设计多任务微调框架,进一步提升大模型在广告反作弊的具体领域中的效果;
3)强化学习:开发对抗性模拟环境,定义奖励函数,优化RL训练流程,解决复杂的作弊场景所面临的攻防问题;
4)优化分布式训练框架,提升大模型集群训练效率,降低单位算力成本。
2、数据处理与特征工程:负责构建多类型的作弊样本库(如黑产群聊文本、虚假点击时序数据等);同时设计数据自动化检测体系,包含通顺度、逻辑性等的检测,生成高质量的数据集;
3、反作弊大模型评估:建设全面的反作弊大模型评估系统,对不同方案出来的模型能及时、准确的评估效果,并选择最优的模型进行上线;
4、反作弊大模型部署:参与模型轻量化与推理加速,同时满足离线和实时调用的实效需求,追求成本和效率的平衡;
5、跨团队协同:与反作弊策略、技术、业务等各个团队合作,将反作弊大模型应用到各个场景中,实质性的提升业务效果。
岗位要求
1、计算机科学、人工智能、网络安全等相关专业硕士及以上学位在读,或特别优秀的本科生(2026届及以后);
2、掌握PyTorch/TensorFlow框架,出色的代码撰写能力,熟悉Transformer、LoRA、PPO等核心算法原理;
3、熟悉NLP相关的算法和技术,主导参与过大影响力的项目或论文者优先、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先;
4、在大模型领域有出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题;
5、良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步;
6、大语言模型研究方向,有垂直领域大模型训练经验优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报