葛女士
上海人工智能创新中心·校招
12分钟前
上次在线
61%
反馈率
5天
处理时长
在招职位 (82)
上海
岗位职责
负责大语言模型及多智能体系统前沿AI风险管理与安全治理核心研究,聚焦模型全生命周期内生风险、外部对抗风险及CBRN专项智能安全防控方向。通过技术创新搭建标准化风控体系,提升前沿模型部署合规性与抗风险能力,推动前沿AI风险治理与跨领域应急防控方案落地应用。
1. 主攻大模型与智能体风险建模、量化识别及可信治理研究,重点攻坚模型对齐失效、数据污染、心智诱导滥用、CBRN智能衍生安全风险等关键课题,构建全维度动态风险研判与感知体系。
2. 研发创新型前沿 AI风险防控策略与核心算法,涵盖风险感知提示工程、高危数据净化、CBRN场景风险隔离与应急阻断技术,实现风险事前预判、事中管控、事后溯源的全闭环治理。
3. 持续跟进全球AI风控、CBRN智能安全、IEC国际安全标准及前沿框架研究进展,参与行业学术研讨、技术攻坚及跨机构风控协同工作。
岗位要求
硕士及以上学历,计算机、人工智能、网络空间安全及AI安全交叉相关专业;
- 精通大语言模型Transformer架构及预训练、微调、对齐全流程技术,具备扎实Python编程功底;
- 深耕大模型安全可信、CBRN智能防控、AI治理交叉领域,具备优秀风险研判、逻辑推演与实验复盘能力;
- 熟练阅读英文专业文献,可快速跟进全球前沿AI安全技术与国际标准动态。
专业经验(满足一项及以上即可)
- 有AI安全、网络攻防、生物安全、风险量化相关科研经历,熟悉大模型安全评测与实验范式;
- 具备大模型安全攻防、多智能体风险模拟、AI安全治理搭建或CBRN风险研判项目实操经验;
- 有大模型对齐微调、复杂风险推理、高危场景管控及合规约束算法研发落地经验。
加分项
- 在NeurIPS、ICML、ACL、CCS、USENIX Security等顶会/期刊发表大模型安全相关论文;
- 具备跨学科研究能力,可将CBRN风控与AI治理理论转化为可计算、可落地的算法模型;
- 参与过IEC/ITU AI安全国际标准、行业安全规范编制或CBRN智能风控专项项目。
申请
上海
岗位职责
1.医学评测数据集构建,包括设计对抗性测试用例,验证模型鲁棒性;
2.参与设计疾病诊断、治疗方案、影像识别等AI医疗模型的评测场景,设计多维度评测指标;
3.整理并结构化医学文献、临床指南、真实病例数据,构建高质量评测语料库;
4.医学任务标注与审核,对文本/影像等医疗数据进行专业标注(如疾病分类、用药建议、手术步骤);审核第三方标注结果,确保符合临床医学逻辑与行业标准;
5.医学评测体系开发医学支持,包括优化标注规范,协助制定质控流程,提升数据可靠性,协助搭建针对AI医疗产品的系统性评测框架。
岗位要求
必备条件:
1.扎实的医学理论基础(熟悉内科/外科/妇科/儿科等核心临床学科知识);
2.能进行英文医学文献阅读和总结,理解专业术语;
3.熟悉卫生健康领域国家标准、行业标准、团队标准等,明晰卫生健康领域各项规范和监管单位通知要求;
4.严谨的逻辑思维与细节把控能力;
5.跨团队协作,能与算法工程师、产品经理沟通医学临床需求,推动评测体系迭代。
优先加分项:
1.有大模型临床科研应用项目经验或临床科研数据整理经验(如医疗垂类大模型应用项目,电子病历分析、临床试验数据管理等);
2.了解常见AI医疗应用场景(如《卫生健康行业人工智能应用场景参考指引》中提及场景。
3.熟悉循证医学、临床诊疗路径或医学统计学知识;
4.对大模型有一定了解并能够熟练使用;
5.对医疗大模型评测有一定的认识和了解;
6.参与过医疗人工智能项目。
申请
上海
岗位职责
1. 研发视觉生成模型相关新技术,包括模型结构与大模型训练框架的构建与优化;
2. 设计视觉生成编辑模型的数据处理流程,构建图像与视频标注平台,提升训练数据质量与标签准确性,增强模型泛化能力;
3. 构建视觉生成编辑模型的评估体系,结合大模型工具开发自动化评估平台,提升模型评测的准确性与效率;
4. 开发模型小型化与轻量化流程,优化模型算子,提升模型运行效率;适配不同的计算平台,实现软硬一体化协同优化;
5. 搭建视觉生成编辑模型的演示平台,优化用户体验;
6. 与产品及工程团队协作,将视觉生成编辑算法落地应用于实际业务场景。"
岗位要求
1. 2027届本科及以上学历,计算机、电子、人工智能、软件、数学等相关专业;
2. 在计算机视觉、多模态、扩散模型等生成式模型、图像处理、机器学习或渲染生成等一个或多个领域有较深入研究;
3. 具备优秀的分析与解决问题能力,能独立应对大模型训练与应用中的技术挑战,并提出创新解决方案;
4. 编程能力突出,熟练掌握Python、CUDA、Triton或C/C++,有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等竞赛获奖经历或大型工程项目落地经验者优先;
5. 具备良好的沟通与协作能力,工作积极主动,能够与团队紧密配合,共同推动前沿技术的落地应用。
加分项:
1. 具备扎实的算法与机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH/SIGGRAPH Asia等顶会或期刊发表论文者优先;
2. 在视觉生成模型、图像处理、大模型、基础模型、世界模型、RL或渲染生成等领域主导过有影响力的项目者优先。"
申请
展开
岗位职责
"致力于探索大模型(LLM)在复杂动态环境下的能力边界。我们坚信,不仅模型参数有 Scaling Law,环境的复杂度和对抗性也存在 Scaling Law——更真实、更残酷、更多变的交互环境,将催生出具备极致泛化能力与鲁棒性的超级智能体。在这里,你将不再局限于静态数据集的微调,而是构建成百上千个充满未知的虚拟世界,利用我们独有的大规模并行演练平台和强化学习框架,见证 AI 在不断的挫折与交互中实现能力的“涌现”。:
1.自动构建多元风险宇宙: 发挥你的想象力与逻辑思维,利用组内现有框架设计并搭建多样化的交互场景(涵盖网络交互、系统操作、逻辑博弈等)。你需要像“关卡设计师”一样,在环境中自动埋设陷阱、噪音与对抗性风险点,挑战 AI 的安全底线。
2.探索安全 Scaling Law: 开展大规模强化学习实验,研究环境数量、环境真实度及任务复杂度与模型泛化性鲁棒性之间的数理关系。验证“在更难的环境中活下来,才能在未知的世界里更安全”这一核心假设。
3.验证效率优化: 深入学习K8S、Ray、Spark等基础架构,二次开发verl、slime等框架,辅助全职员工提升组内AI Infra的相关效率。
4.涌现验证: 对智能体交互轨迹数据进行自动化挖掘,找出导致模型“幻觉”或“崩溃”的深层原因,深入分析Agent在交互过程中产生的“顿悟”时刻(Aha Moments),挖掘模型在长链路决策中的行为模式,为算法优化提供关键洞察。"
岗位要求
"我们要找的不是只会调包的“炼丹师”,而是极具灵气与好奇心的“探索者”。我们不要求你精通底层架构,但希望你:
1.聪明且逻辑严密: 本科/硕士/博士均可,计算机、数学、物理或相关专业。你的大脑需要能比模型“多想一步”。
2.代码能力强: 熟练掌握 Python,Coding 习惯良好,可以快速掌握新框架,学习能力强。
3.实习稳定性: 最少6个月,希望9个月以上。
4.黑客松精神: 喜欢折腾,不满足于标准答案。你渴望让模型去操作手机、浏览器、去写代码、去解决真实世界的难题,越难越好。"
申请
上海
岗位职责
聚焦宏观战略研判、前沿趋势分析、竞争情报研究,为实验室重大决策提供核心支撑。 同时支撑实验室各中心面向政府,项目申报的材料输出,政策上传下达。
岗位职责:
1.面向国家科技战略需求与人工智能发展前沿,跟踪国内外相关政策、规划、改革方案的创新举措,系统研判趋势与影响,提出具有建设性的对策建议。
2.承担重大政策研究报告及相关综合性文件的起草与统筹。 3.组织开展科技政策与新型科研机构建设等重大议题的系统性调研。
4.建立维护与各类研究机构的合作网络,开展合作研究。
5.承担和完成领导交办的其他工作。
岗位要求
1.有良好的政治品德,身心健康、遵纪守法、品行端正、诚实守信,有创新意识和开拓精神。
2.具备人工智能、计算机相关专业背景优先,拥有跨学科专业背景者优先。
3.具备较强的公文写作和报告撰写能力,能够独立承担调研、战略研究等相关工作,有相关领域工作经验者优先。
4.具有良好的团队协作与人际沟通能力,有较强的责任心和抗压能力。
申请
上海
岗位职责
为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
1、优化大模型训练效率,包括应用CUDA高性能优化、Data IO、分布式并行、通讯库优化等技术提升训练效率;
2、与团队合作,优化模型架构,提升训练的可扩展性,提升超大规模训练的稳定性与MFU;
3、大模型全开发流程优化(数据处理,预训练,后训练,推理服务)。
岗位要求
1、本科及以上学历在读,计算机、软件工程、人工智能等相关专业优先;
2、有至少其中一项技能/知识:熟悉一种训练框架、GPU编程、高性能分布式训练、LLM/多模态大模型推理优化;
3、有好奇心,自驱力强,有较好的学习能力和沟通能力,编程能力强;
4、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
加分项:
1、有大模型相关经验,在AI Infra、强化学习、AI Agent等领域进行过深入调研和探索;
2、有以下某一领域的经验:CPU/GPU体系架构,高性能计算/CUDA,分布式训练系统。
申请
上海
岗位职责
为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
1、与团队合作训练多模态世界模型;
2、多模态世界模型开发框架的搭建(数据、训练、微调、评测);
3、搭建训练和微调框架,提高模型理解物理世界规则的能力。"
岗位要求
1、本科及以上学历,计算机、电子、数学等相关专业;
2、有至少其中一项技能/知识:LLM/多模态大模型训练、世界模型训练、能量模型训练;
3、具有出色的分析、解决问题的能力,能深入解决模型训练、应用存在的问题,有自主探索解决方案的能力者;
4、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。
加分项:
1、有重量级开源项目经历或者顶级会议/期刊发表论文者优先;
2、具有优秀的代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOl、Kaggle等比赛获奖者优先;
3、主导过多模态、大模型、世界模型或者能量模型项目者优先。
申请
上海
岗位职责
"主要职责:
1.探索人工智能与物理、化学、材料科学的深度融合,参与AI驱动的国家战略关键材料的智能研发。
2.构建大模型驱动的材料发现与优化的多智能体系统,助力材料的智能发现、合成路径设计、配方和工艺优化及性能预测。
3.探索材料发现AI新范式,推向通用材料发现智能系统
4.与前沿团队密切合作,共同推动AI技术在化学、材料、制造等交叉领域的落地应用。"
岗位要求
"基本要求:
1.具有物理、计算化学、计算机科学、人工智能、数学等相关专业硕士或博士学位
2.对AI for science领域的前沿研究充满热情,渴望通过技术推动科学进步,以第一作者身份在AI领域顶会顶刊上有相关成果发表,或在相关领域有突出研究成果,如Nature、Science或重要子刊、PR系列上的论文发表;
3.优秀的编程能力,了解数据结构与算法。熟练掌握python,熟练使用主流深度学习框架如pytorch。 了解熟悉Transformer/VAE/GNN/Diffusion Model/Bayesian Learning/Reinforcement Learning等。
4.具备较强的独立问题分析和解决能力,能够解决复杂的AI+材料交叉问题。
5.具备良好的沟通表达能力与团队合作精神,能够与跨学科团队高效合作。
加分项:
1.有计算物理、化学、材料背景,具备分子建模能力,熟悉化学结构建模工具(如RDKit、Mordred) 具有多模态大模型、生成模型经验证优先。
2.有开源项目经验或AI相关竞赛成绩。"
申请
上海
岗位职责
我们正在寻找对大模型、数据生成与系统化评测充满热情的优秀研究者加入团队。我们将为您提供顶尖的科研环境与成长平台,共同推动通专融合的智能模型的前沿探索。
岗位职责
1. 开展前沿算法研究,提升生成数据的质量与可靠性,突破当前大模型在长尾场景覆盖不足、数据多样性有限以及安全可信性薄弱等方面的瓶颈;
2. 研发动态更新算法与机制,使模型能够持续适应最新的知识与环境变化,保持预测与生成能力的时效性;
3. 构建大模型的自动化的评测体系,能有效且系统性的对生成内容进行评估,包括但不限于真实性、多样性、多模态对齐,应用效用与安全可信;
4. 针对高壁垒的关键应用领域(如医疗、金融、法律等)中存在的数据稀缺与复杂罕见场景,开发先进生成技术提升模型的专业知识覆盖与场景适应力,为高价值AI应用 奠定坚实的基础。"
岗位要求
岗位要求
1. 计算机科学、人工智能、数据科学、统计或相关方向的博士或者硕士,有突出研究成果者优先;
2. 具备扎实的机器学习与深度学习基础,熟悉大模型相关技术(如大语言模型、多模态学习、自监督学习、强化学习等);
3. 在相关领域发表过高水平论文,或主导过核心开源项目者优先,并有较强的发现问题、分析问题与解决问题能力;
4. 具备优秀的编程能力(Python为主),有实际模型训练、数据处理及生成或评估体系构建经验;
5. 具有构建模型评测基准(Benchmark)、自动化评估系统的实践经验或者跨学科科研合作经验优先;"
申请
上海
岗位职责
1. 研究视觉生成模型的前沿技术,包括新型模型架构、训练方法,以及探索提升模型鲁棒性、降低错误信息生成概率的技术路径;
2. 探索小型化、轻量化的图像与视频生成技术,压缩模型规模,减少推理时间与内存占用,降低模型训练成本;
3. 探索提升生成处理的可信性,提升物理真实性;
4. 研究视觉生成模型在图像/视频编辑与处理等下游任务中的应用,增强编辑处理过程的可控性与稳定性,避免生成式方法引入的误差;
5. 推动Agent、思维链、强化学习、Test-time scaling等前沿技术在视觉生成处理中的融合与应用;
6. 拓展视觉生成模型在特定场景下的应用,如特定场景生成、科学计算任务、具身智能等方向。"
岗位要求
1. 2027届本科及以上学历,计算机、电子、人工智能、软件、数学等相关专业;
2. 在计算机视觉、多模态、扩散模型等生成式模型、图像处理、机器学习或渲染生成等一个或多个领域有较深入研究;
3. 具备独立开展研究的能力,对视觉生成模型的训练与应用有深刻理解,熟悉相关领域研究动态,具备自主探索与解决新问题的能力;
4. 具有良好的沟通协作能力,工作积极主动,能够融入团队共同探索新技术、推动技术发展。
加分项:
1. 具备扎实的算法与机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH/SIGGRAPH Asia等顶会或期刊发表论文者优先;
2. 编程能力突出,熟练掌握Python、CUDA、Triton或C/C++,曾在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛中获奖者优先;
3. 在视觉生成模型、图像处理、大模型、基础模型、世界模型、RL或渲染生成等领域主导过有影响力的项目者优先;
4. 具备视觉生成研究或项目经验,同时拥有化学、生物、医疗、具身智能等交叉领域背景者优先"
申请
上海
岗位职责
1. 研究大模型、智能体的潜在安全风险,构建自动化漏洞发现与风险扫描流水线;
2. 设计并开发自动化红队攻击框架,实现对模型推理、训练阶段攻击技术的批量化、流程化执行;
3. 设计新型防御方案(鲁棒性增强、异常检测、安全对齐、动态防御机制),构建自动化安全评估与持续回归测试体系,实现攻防闭环迭代;
4. 多模态安全体系构建:研究跨文本、图像、语音的多模态攻击向量(如跨模态对抗攻击、多模态数据污染);
5. 构建融合多模态特征的安全检测系统,开发针对AIGC内容的水印、溯源技术;探索视觉-语言模型(VLM)的对抗防御策略与可解释性分析。
岗位要求
- 硕士及以上学历,计算机科学/网络安全/人工智能相关专业;具备AI安全领域经验,精通大模型架构(Transformer/BERT/GPT系列);
- 熟练掌握对抗机器学习技术:FGSM/PGD攻击、防御蒸馏、对抗训练等;具备多模态模型实战经验(CLIP/Stable Diffusion/DALL-E等);
- 精通Python,熟悉主流AI框架(PyTorch/TensorFlow/JAX);
- 熟悉模型逆向、对抗攻击、数据投毒、模型鲁棒性增强、输入输出过滤和安全对齐技术(RLHF/宪法AI);
- 具备自动化工具/平台开发能力,有构建端到端自动化攻击或评估Pipeline的实际经验。
加分项:
- 在NeurIPS/ICLR/CCS等顶会发表AI安全相关论文;
- 参与过主流大模型安全评估项目(如MITRE ATLAS框架);有CTF/AI安全竞赛获奖经历;
- 熟悉OWASP Top 10 for LLM等安全标准;
- 有开源自动化AI安全工具开发或贡献经验;有基于LLM驱动的自动化攻击/防御Agent开发经验者优先。
申请
上海
岗位职责
1. 负责跟进研究业界顶尖网络安全攻防技术,重点围绕自动化漏洞挖掘、自动化渗透测试、智能化威胁检测等方向;
2. 负责设计并开发自动化反入侵、反攻击、反劫持和审计系统工具,推动安全运营从人工驱动向自动化、智能化演进;
3. 负责构建自动化安全事件应急响应与编排平台,实现事件自动分析、跟踪、定位与处置,通过自动化手段持续梳理安全风险并驱动治理闭环。
岗位要求
1. 专业不限,有技术洞察力,对安全技术有狂热的追求,对新技术有热忱,有意愿在安全领域长期保持专注和投入;
2. 熟悉漏洞挖掘、网络安全攻防技术,了解常见黑客攻击手法,对自动化攻防工具链(如自动化扫描、Fuzzing、漏洞利用框架等)有深入理解和实操经验;
3. 熟练使用C/C++/Rust等至少一门语言,熟悉Python/Java/PHP/Go等至少一种程序开发语言,具备独立开发自动化安全工具或平台的能力;
4. 对数据库、操作系统、网络原理等计算机学科基础知识有较好储备。
加分项
1. 拥有实际软件逆向、漏洞分析利用或对抗方案开发的经验,尤其具备自动化漏洞挖掘或自动化利用生成经验;
2. 拥有大数据安全风控、红蓝对抗、主机安全、流量安全等项目或实习经验,有自动化红蓝对抗平台(BAS)建设或自动化攻击模拟经验者优先;
3. 拥有安全渗透测试、安全威胁分析和应急响应处置经验;
4. 有将AI/LLM技术应用于安全自动化场景(如智能漏洞分析、自动化威胁情报处理、AI辅助渗透等)的探索或实践经验
申请
上海
岗位职责
1、参与多模态理解、图像/视频生成、物理保真生成、强化学习、世界模型等方向的算法研发与优化;
2、协助构建与优化大规模多模态理解与生成基础模型,包括多模态数据库建设、大规模数据处理、分布式训练体系的构建和推理框架优化;
3、开发数据合成、标注体系、模型推理与编辑交互等关键技术模块,开发并维护多模态数据制作管线,参与评测体系设计与实现;
4、与产品、平台和工程团队协作,将前沿算法高效转化为可规模化应用的工程方案。
岗位要求
1、2027届本科及以上学历,计算机、人工智能、电子信息等相关专业;
2、熟悉计算机视觉、多模态大模型、内容生成(AIGC)或物理渲染等领域的一种或多种技术;
3、熟练掌握Python或C/C++,具备良好的工程实现与调试能力;
4、具备独立分析与解决问题的能力,能够应对模型训练、推理与应用中的技术挑战;
5、拥有良好的沟通与协作能力,工作积极主动,能够与团队紧密配合,共同探索前沿技术并推动落地应用。
加分项:
1、在CV、AIGC、NLP、RL、ML等领域具备扎实的算法与机器学习基础,并在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊发表过论文;
2、有ACM/ICPC、NOI/IOI、TopCoder、Kaggle等竞赛获奖经历;
3、有分布式训练、大规模数据处理、推理优化等工程经验。
申请
展开
岗位职责
1. 负责多模态Agent的架构设计与核心算法研发,使其能够胜任GUI操作、深度研究(Deep Research)、软件自动化等复杂的生产力任务
2. 负责多模态Agent框架的设计和平台的开发,以Agent的形式突破现有模型无法解决的真实任务,解决现有模型难以应对的实际挑战
3. 深入研究并应用多模态大模型在UI理解与工具调用等领域的强化训练方法,增强大模型在长程任务下自主规划、泛化决策、自我反思能力,以应对复杂任务链
4. 设计并构建面向人类生产力任务的Agent高级仿真训练环境。环境具备动态生成、难度递增的任务序列,以促进智能体的课程学习与持续进化
5. 设计并构建一套针对开放式、模糊任务的通用可量化评估指标体系,打破当前主流基于规则的奖励机制的局限性
岗位要求
1. 计算机科学、人工智能、自然语言处理、数学等相关专业硕士及以上学历,博士优先
2. 在以下一个或多个领域有深入研究和成果:大语言模型/多模态模型、强化学习(RL)、持续学习、AI 智能体。在NeurIPS、ICLR、ICML、ACL、CVPR、ICCV等顶级会议上发表论文者优先
3. 具备扎实的机器学习基础,熟悉PyTorch/TensorFlow等框架,有大规模语言模型训练与优化经验
4. 具备优秀的编程能力(熟练使用Python)和算法实现能力(精通PyTorch/TensorFlow等框架),能够快速将理论想法转化为可验证的系统原型
5. 具有良好的沟通协作能力,持续追踪AI Agent领域的最新进展,对前沿技术保持高度热情与敏感度,勇于探索技术边界
申请
展开
岗位职责
1. 开展大模型后训练阶段的算法研究,特别是针对智能体系统的轻量化自我演化方向;
2. 开展大模型合成数据方法的优化研究,特别是针对预训练阶段的数据合成方法;
3. 参与学术讨论和技术交流,撰写研究报告、技术文档或论文,鼓励在国际顶级期刊或会议上发表研究成果。
岗位要求
1. 研究生及以上学历,计算机科学、数学、统计学或相关专业。
2. 熟悉大模型训练流程:具有模型训练经验,熟悉SFT、RLHF等方法;
3. 熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
4. 能实习6个月及以上优先。
加分项
1. 在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以第一作者身份发表论文;
2. 参与开发过有影响力的开源项目,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩。
申请
展开
岗位职责
1. 构建面向真实任务的通用Agent框架,专注于其在GUI操作、深度研究(Deep Research)及软件自动化等核心场景下的系统实现、性能优化与稳定性保障
2. 快速实现并验证AI Agent框架的原型。将最新的模型与算法高效与现有产品与服务高效集成,主导模型推理优化(如量化、蒸馏等),以提升部署效率与服务性能
3. 主导开发Agent仿真训练平台与交互式评测系统。您将负责构建一套通用、可量化的评估指标体系,完成从后端架构设计、API开发到前端数据可视化等环节的实现
4. 探索并孵化创新的Agent应用产品。深入洞察市场与用户需求,主导开发如Manus、Copilot形态的智能助手,为开发者和平台用户提供的效率工具,提升用户体验
岗位要求
1. 计算机或相关专业硕士及以上学历,具备扎实的算法/数据结构基础与丰富的软件工程实践经验
2. 对大模型Agent有较深入的理解,熟悉Agent Architectures / Structures(ReAct/PlanAct/CodeAct),了解Agent相关的交互协议(MCP、A2A、FunctionCall),熟悉常见的大模型应用栈(从模型推理优化到应用层框架如 LangChain / Langgraph等)
3. 精通Python,熟悉至少一种主流深度学习框架(如PyTorch, TensorFlow),熟悉后端开发技术栈(如FastAPI, Django),理解RESTful API设计原则与数据库应用
4. 具备卓越的技术沟通能力,能够撰写高质量的技术文档、教程及示例代码;同时拥有出色的进度管理和多团队协作能力
5. 加分项: 有全栈开发经验,或在开源社区(特别是Agent相关项目)有突出贡献者优先
申请
上海
岗位职责
开展下一代大模型基础架构的前沿研究工作,专注于探索混合专家(MoE)、高效注意力机制(Efficient Attention)、扩散语言模型(Diffusion LLM)等核心架构创新。通过从根本上重塑模型的计算范式,旨在突破现有Transformer架构在性能、效率和可扩展性上的瓶颈,为通用人工智能的发展构建更强大的基石。
1. 开展大语言及多模态大模型的新一代骨干网络架构研究,包括但不限于混合专家、高效注意力机制(如线性/稀疏注意力)以及扩散语言模型等架构的探索与设计。
2. 负责新型模型架构及核心组件的代码实现、性能优化与验证,确保新架构在训练和推理中的高效性、稳定性与可扩展性。
3. 关注和学习NeurIPS、ICML、ICLR等最新前沿研究,参与学术讨论和撰写学术论文,在国际顶级期刊或会议上发表研究成果。"
岗位要求
1. 博士学历或研究成果突出的硕士,计算机科学、人工智能、软件工程或相关专业。
2. 熟练Python编程,具备从零复现和优化复杂模型架构的扎实工程能力,有高性能算子实现经验者优先。
3. 对Transformer架构有深刻理解,熟悉MoE、各类Attention变体等前沿技术;对OpenAI、Qwen、DeepSeek等主流大模型的架构有深入了解,有相关顶会论文或核心开源项目贡献者优先。
4. 具备优秀的科学批判思维和团队合作精神,拥有较强的自主学习和问题解决能力,能够独立设计并执行创新性的研究想法。"
申请
上海
岗位职责
1. 研究基座模型谄媚等异常行为的内在作用机理,系统分析其与模型安全风险、幻觉生成等核心问题的内在关联;
2. 探索大模型训练动力学规律,追踪并解析不同训练阶段模型内部表征与外在行为特征的演变过程;
3. 研发基于可解释性技术驱动的数据合成方法,用于提升基座模型的通用能力与鲁棒性;
4. 参与学术讨论和技术交流,撰写研究报告、技术文档或论文,鼓励在国际顶级期刊或会议上发表研究成果。
岗位要求
1. 研究生及以上学历,计算机科学、数学、统计学或相关专业;
2. 熟悉大模型解释性算法:SAE、Probing、Attribution、Circuit Tracing等;
3. 熟悉大模型训练流程:具有LLM或多模态模型训练经验,熟悉SFT、RLHF等方法;
4. 熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5. base 上海,每周出勤天数≥4天,能实习6个月及以上优先。
加分项
1. 在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以第一作者身份发表论文;
2. 参与开发过有影响力的开源项目,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩。
申请
上海
岗位职责
1. 探索Agent系统安全能力,构建基于OpenClaw等开源智能体框架的安全能力系统,研发相应的工具/算法;
2. 研发智能体核心能力,提升语言模型和/或多模态模型在多轮交互、工具调用能力在丰富场景的稳定性与泛化能力;
3. 搭建评测体系,设计Agent能力相关的评测任务和指标,追踪训练效果,驱动训练闭环优化;
4. 将研究成果转化为开源代码,沉淀可复用的智能体安全组件。
岗位要求
1. 本科生及以上学历,计算机科学、数学、统计学或相关专业;
2. 熟悉智能体系统设计,包括 Skills、Memory 等功能模块的设计与实现;
3. 熟悉强化学习基础知识以及大模型后训练技术,熟悉verl等训练框架优先;
4. 熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5. base 上海,每周出勤天数≥4天,能实习6个月及以上优先。
加分项
1. 参与开发过有影响力的开源项目;
2. 在ACM/ICPC,Kaggle等竞赛中取得过优异成绩;
3. 在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文。
申请
上海
岗位职责
在这个岗位上,你将有机会接触并参与到以下一个或多个前沿方向:
1、参与分布式训练架构探索:协助研究与设计下一代大模型训练系统,探索包括数据并行、模型并行、流水线并行在内的混合并行策略。
2、攻坚系统性能瓶颈:参与大模型推理架构与多智能体强化学习探索:协助研究与设计智能推理框架,探索包括P/D分离、Agentic Reasoning、kernel推理加速在内的服务优化策略。
3、研发高效训练工具链:参与开发或优化内部训练框架、性能剖析工具及自动化调度系统,提升平台资源利用率和研发效率。
4、跟踪并实践前沿技术:追踪业界最新技术动态(如MoE、无限上下文、多模态训练等),并尝试将其集成到我们的系统中以解决实际问题。
5、参与开源社区与技术分享:鼓励将研究成果以技术博客、开源代码或学术论文的形式输出,与全球社区共同进步。
岗位要求
1、学历专业:2027届应硕/博士研究生,计算机科学、人工智能、电子工程或相关专业。
2、知识基础:
- 扎实的计算机系统基础,熟悉操作系统、计算机网络、数据结构与算法。
- 熟悉Python/C++等至少一门主流编程语言,具备良好的工程实现能力。
- 了解PyTorch或TensorFlow等深度学习框架的基本原理和使用。
3、良好的团队协作精神:善于沟通,乐于分享,能与团队成员高效协作。
4、至少实习4个月及以上。
加分项(具备以下任一经验者优先):
1、在相关领域的顶级会议(如NeurIPS, ICML, MLSys, OSDI等)或期刊上有论文发表或投稿经历。
2、有分布式系统、高性能计算相关的课程项目、研究课题或实习经验。
3、熟悉MPI、NCCL等通信库,或对CUDA编程有基本了解。-
有活跃的开源项目贡献经历。
申请
上海人工智能实验室 未融资 上海
上海人工智能实验室 2020 年 7 月揭牌成立,是我国人工智能领域新型研发机构,聚焦战略性、原创性、前瞻性研究。实验室汇聚全球顶尖科研力量,由汤晓鸥、周伯文等学者领衔,构建 “连接器、放大器、加速器” 三器生态。自主研发 “书生” 大模型体系,包括 InternLM 通用大模型、Intern-S1 科学多模态大模型,推出书生・浦语、书生・天际等系列产品。2025 年联合发布十项 “AI + 科学” 突破性成果,覆盖量子计算、生命科学、材料科学等领域。实验室打通基础研究到产业落地全链路,孵化相风科技等企业,推动 AI 技术在气象、医疗、航天等领域应用,是中国人工智能创新发展的核心策源地。