葛女士
上海人工智能创新中心·校招
10分钟前
上次在线
27%
反馈率
1天
处理时长
在招职位 (61)
上海
岗位职责
我们正在寻找对大模型、数据生成与系统化评测充满热情的优秀研究者加入团队。我们将为您提供顶尖的科研环境与成长平台,共同推动通专融合的智能模型的前沿探索。
岗位职责
1. 开展前沿算法研究,提升生成数据的质量与可靠性,突破当前大模型在长尾场景覆盖不足、数据多样性有限以及安全可信性薄弱等方面的瓶颈;
2. 研发动态更新算法与机制,使模型能够持续适应最新的知识与环境变化,保持预测与生成能力的时效性;
3. 构建大模型的自动化的评测体系,能有效且系统性的对生成内容进行评估,包括但不限于真实性、多样性、多模态对齐,应用效用与安全可信;
4. 针对高壁垒的关键应用领域(如医疗、金融、法律等)中存在的数据稀缺与复杂罕见场景,开发先进生成技术提升模型的专业知识覆盖与场景适应力,为高价值AI应用 奠定坚实的基础。
岗位要求
岗位要求
1. 计算机科学、人工智能、数据科学、统计或相关方向的博士或者硕士,有突出研究成果者优先;
2. 具备扎实的机器学习与深度学习基础,熟悉大模型相关技术(如大语言模型、多模态学习、自监督学习、强化学习等);
3. 在相关领域发表过高水平论文,或主导过核心开源项目者优先,并有较强的发现问题、分析问题与解决问题能力;
4. 具备优秀的编程能力(Python为主),有实际模型训练、数据处理及生成或评估体系构建经验;
5. 具有构建模型评测基准(Benchmark)、自动化评估系统的实践经验或者跨学科科研合作经验优先;
申请
上海
岗位职责
1. 研究视觉生成模型的前沿技术,包括新型模型架构、训练方法,以及探索提升模型鲁棒性、降低错误信息生成概率的技术路径;
2. 探索小型化、轻量化的图像与视频生成技术,压缩模型规模,减少推理时间与内存占用,降低模型训练成本;
3. 探索提升生成处理的可信性,提升物理真实性;
4. 研究视觉生成模型在图像/视频编辑与处理等下游任务中的应用,增强编辑处理过程的可控性与稳定性,避免生成式方法引入的误差;
5. 推动Agent、思维链、强化学习、Test-time scaling等前沿技术在视觉生成处理中的融合与应用;
6. 拓展视觉生成模型在特定场景下的应用,如特定场景生成、科学计算任务、具身智能等方向。
岗位要求
1. 2027届本科及以上学历,计算机、电子、人工智能、软件、数学等相关专业;
2. 在计算机视觉、多模态、扩散模型等生成式模型、图像处理、机器学习或渲染生成等一个或多个领域有较深入研究;
3. 具备独立开展研究的能力,对视觉生成模型的训练与应用有深刻理解,熟悉相关领域研究动态,具备自主探索与解决新问题的能力;
4. 具有良好的沟通协作能力,工作积极主动,能够融入团队共同探索新技术、推动技术发展。
加分项:
1. 具备扎实的算法与机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH/SIGGRAPH Asia等顶会或期刊发表论文者优先;
2. 编程能力突出,熟练掌握Python、CUDA、Triton或C/C++,曾在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛中获奖者优先;
3. 在视觉生成模型、图像处理、大模型、基础模型、世界模型、RL或渲染生成等领域主导过有影响力的项目者优先;
4. 具备视觉生成研究或项目经验,同时拥有化学、生物、医疗、具身智能等交叉领域背景者优先
申请
上海
岗位职责
1. 研究大模型、智能体的潜在安全风险,构建自动化漏洞发现与风险扫描流水线;
2. 设计并开发自动化红队攻击框架,实现对模型推理、训练阶段攻击技术的批量化、流程化执行;
3. 设计新型防御方案(鲁棒性增强、异常检测、安全对齐、动态防御机制),构建自动化安全评估与持续回归测试体系,实现攻防闭环迭代;
4. 多模态安全体系构建:研究跨文本、图像、语音的多模态攻击向量(如跨模态对抗攻击、多模态数据污染);
5. 构建融合多模态特征的安全检测系统,开发针对AIGC内容的水印、溯源技术;探索视觉-语言模型(VLM)的防御策略与可解释性分析。
岗位要求
- 硕士及以上学历,计算机科学/网络安全/人工智能相关专业;具备AI安全领域经验,精通大模型架构(Transformer/BERT/GPT系列);
- 熟练掌握机器学习技术:FGSM/PGD攻击、防御蒸馏等;具备多模态模型实战经验(CLIP/Stable Diffusion/DALL-E等);
- 精通Python,熟悉主流AI框架(PyTorch/TensorFlow/JAX);
- 熟悉模型逆向、数据投毒、模型鲁棒性增强、输入输出过滤和安全对齐技术(RLHF/宪法AI);
- 具备自动化工具/平台开发能力,有构建端到端自动化攻击或评估Pipeline的实际经验。
加分项:
- 在NeurIPS/ICLR/CCS等顶会发表AI安全相关论文;
- 参与过主流大模型安全评估项目(如MITRE ATLAS框架);有CTF/AI安全竞赛获奖经历;
- 熟悉OWASP Top 10 for LLM等安全标准;
- 有开源自动化AI安全工具开发或贡献经验;有基于LLM驱动的自动化攻击/防御Agent开发经验者优先。
申请
上海
岗位职责
1. 负责跟进研究业界顶尖网络安全攻防技术,重点围绕自动化漏洞挖掘、自动化渗透测试、智能化检测等方向;
2. 负责设计并开发自动化反入侵、反攻击、反劫持和审计系统工具,推动安全运营从人工驱动向自动化、智能化演进;
3. 负责构建自动化安全事件应急响应与编排平台,实现事件自动分析、跟踪、定位与处置,通过自动化手段持续梳理安全风险并驱动治理闭环。
岗位要求
1. 专业不限,有技术洞察力,对安全技术有狂热的追求,对新技术有热忱,有意愿在安全领域长期保持专注和投入;
2. 熟悉漏洞挖掘、网络安全攻防技术,了解常见黑客攻击手法,对自动化攻防工具链(如自动化扫描、Fuzzing、漏洞利用框架等)有深入理解和实操经验;
3. 熟练使用C/C++/Rust等至少一门语言,熟悉Python/Java/PHP/Go等至少一种程序开发语言,具备独立开发自动化安全工具或平台的能力;
4. 对数据库、操作系统、网络原理等计算机学科基础知识有较好储备。
加分项
1. 拥有实际软件逆向、漏洞分析利用的经验,尤其具备自动化漏洞挖掘或自动化利用生成经验;
2. 拥有大数据安全风控、主机安全、流量安全等项目或实习经验,有自动化红蓝平台(BAS)建设或自动化攻击模拟经验者优先;
3. 拥有安全渗透测试和应急响应处置经验;
4. 有将AI/LLM技术应用于安全自动化场景(如智能漏洞分析、自动化威胁情报处理、AI辅助渗透等)的探索或实践经验
申请
上海
岗位职责
1、参与多模态理解、图像/视频生成、物理保真生成、强化学习、世界模型等方向的算法研发与优化;
2、协助构建与优化大规模多模态理解与生成基础模型,包括多模态数据库建设、大规模数据处理、分布式训练体系的构建和推理框架优化;
3、开发数据合成、标注体系、模型推理与编辑交互等关键技术模块,开发并维护多模态数据制作管线,参与评测体系设计与实现;
4、与产品、平台和工程团队协作,将前沿算法高效转化为可规模化应用的工程方案。
岗位要求
1、2027届本科及以上学历,计算机、人工智能、电子信息等相关专业;
2、熟悉计算机视觉、多模态大模型、内容生成(AIGC)或物理渲染等领域的一种或多种技术;
3、熟练掌握Python或C/C++,具备良好的工程实现与调试能力;
4、具备独立分析与解决问题的能力,能够应对模型训练、推理与应用中的技术挑战;
5、拥有良好的沟通与协作能力,工作积极主动,能够与团队紧密配合,共同探索前沿技术并推动落地应用。
加分项:
1、在CV、AIGC、NLP、RL、ML等领域具备扎实的算法与机器学习基础,并在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊发表过论文;
2、有ACM/ICPC、NOI/IOI、TopCoder、Kaggle等竞赛获奖经历;
3、有分布式训练、大规模数据处理、推理优化等工程经验。
申请
展开
岗位职责
1. 负责多模态Agent的架构设计与核心算法研发,使其能够胜任GUI操作、深度研究(Deep Research)、软件自动化等复杂的生产力任务
2. 负责多模态Agent框架的设计和平台的开发,以Agent的形式突破现有模型无法解决的真实任务,解决现有模型难以应对的实际挑战
3. 深入研究并应用多模态大模型在UI理解与工具调用等领域的强化训练方法,增强大模型在长程任务下自主规划、泛化决策、自我反思能力,以应对复杂任务链
4. 设计并构建面向人类生产力任务的Agent高级仿真训练环境。环境具备动态生成、难度递增的任务序列,以促进智能体的课程学习与持续进化
5. 设计并构建一套针对开放式、模糊任务的通用可量化评估指标体系,打破当前主流基于规则的奖励机制的局限性
岗位要求
1. 计算机科学、人工智能、自然语言处理、数学等相关专业硕士及以上学历,博士优先
2. 在以下一个或多个领域有深入研究和成果:大语言模型/多模态模型、强化学习(RL)、持续学习、AI 智能体。在NeurIPS、ICLR、ICML、ACL、CVPR、ICCV等顶级会议上发表论文者优先
3. 具备扎实的机器学习基础,熟悉PyTorch/TensorFlow等框架,有大规模语言模型训练与优化经验
4. 具备优秀的编程能力(熟练使用Python)和算法实现能力(精通PyTorch/TensorFlow等框架),能够快速将理论想法转化为可验证的系统原型
5. 具有良好的沟通协作能力,持续追踪AI Agent领域的最新进展,对前沿技术保持高度热情与敏感度,勇于探索技术边界
申请
展开
岗位职责
1. 开展大模型后训练阶段的算法研究,特别是针对智能体系统的轻量化自我演化方向;
2. 开展大模型合成数据方法的优化研究,特别是针对预训练阶段的数据合成方法;
3. 参与学术讨论和技术交流,撰写研究报告、技术文档或论文,鼓励在国际顶级期刊或会议上发表研究成果。
岗位要求
1. 研究生及以上学历,计算机科学、数学、统计学或相关专业。
2. 熟悉大模型训练流程:具有模型训练经验,熟悉SFT、RLHF等方法;
3. 熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
4. 能实习6个月及以上优先。
加分项
1. 在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以第一作者身份发表论文;
2. 参与开发过有影响力的开源项目,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩。
申请
展开
岗位职责
1. 构建面向真实任务的通用Agent框架,专注于其在GUI操作、深度研究(Deep Research)及软件自动化等核心场景下的系统实现、性能优化与稳定性保障
2. 快速实现并验证AI Agent框架的原型。将最新的模型与算法高效与现有产品与服务高效集成,主导模型推理优化(如量化、蒸馏等),以提升部署效率与服务性能
3. 主导开发Agent仿真训练平台与交互式评测系统。您将负责构建一套通用、可量化的评估指标体系,完成从后端架构设计、API开发到前端数据可视化等环节的实现
4. 探索并孵化创新的Agent应用产品。深入洞察市场与用户需求,主导开发如Manus、Copilot形态的智能助手,为开发者和平台用户提供的效率工具,提升用户体验
岗位要求
1. 计算机或相关专业硕士及以上学历,具备扎实的算法/数据结构基础与丰富的软件工程实践经验
2. 对大模型Agent有较深入的理解,熟悉Agent Architectures / Structures(ReAct/PlanAct/CodeAct),了解Agent相关的交互协议(MCP、A2A、FunctionCall),熟悉常见的大模型应用栈(从模型推理优化到应用层框架如 LangChain / Langgraph等)
3. 精通Python,熟悉至少一种主流深度学习框架(如PyTorch, TensorFlow),熟悉后端开发技术栈(如FastAPI, Django),理解RESTful API设计原则与数据库应用
4. 具备卓越的技术沟通能力,能够撰写高质量的技术文档、教程及示例代码;同时拥有出色的进度管理和多团队协作能力
5. 加分项: 有全栈开发经验,或在开源社区(特别是Agent相关项目)有突出贡献者优先
申请
上海
岗位职责
开展下一代大模型基础架构的前沿研究工作,专注于探索混合专家(MoE)、高效注意力机制(Efficient Attention)、扩散语言模型(Diffusion LLM)等核心架构创新。通过从根本上重塑模型的计算范式,旨在突破现有Transformer架构在性能、效率和可扩展性上的瓶颈,为通用人工智能的发展构建更强大的基石。
1. 开展大语言及多模态大模型的新一代骨干网络架构研究,包括但不限于混合专家、高效注意力机制(如线性/稀疏注意力)以及扩散语言模型等架构的探索与设计。
2. 负责新型模型架构及核心组件的代码实现、性能优化与验证,确保新架构在训练和推理中的高效性、稳定性与可扩展性。
3. 关注和学习NeurIPS、ICML、ICLR等最新前沿研究,参与学术讨论和撰写学术论文,在国际顶级期刊或会议上发表研究成果。
岗位要求
1. 博士学历或研究成果突出的硕士,计算机科学、人工智能、软件工程或相关专业。
2. 熟练Python编程,具备从零复现和优化复杂模型架构的扎实工程能力,有高性能算子实现经验者优先。
3. 对Transformer架构有深刻理解,熟悉MoE、各类Attention变体等前沿技术;对OpenAI、Qwen、DeepSeek等主流大模型的架构有深入了解,有相关顶会论文或核心开源项目贡献者优先。
4. 具备优秀的科学批判思维和团队合作精神,拥有较强的自主学习和问题解决能力,能够独立设计并执行创新性的研究想法。
申请
上海
岗位职责
1. 研究基座模型谄媚等异常行为的内在作用机理,系统分析其与模型安全风险、幻觉生成等核心问题的内在关联;
2. 探索大模型训练动力学规律,追踪并解析不同训练阶段模型内部表征与外在行为特征的演变过程;
3. 研发基于可解释性技术驱动的数据合成方法,用于提升基座模型的通用能力与鲁棒性;
4. 参与学术讨论和技术交流,撰写研究报告、技术文档或论文,鼓励在国际顶级期刊或会议上发表研究成果。
岗位要求
1. 研究生及以上学历,计算机科学、数学、统计学或相关专业;
2. 熟悉大模型解释性算法:SAE、Probing、Attribution、Circuit Tracing等;
3. 熟悉大模型训练流程:具有LLM或多模态模型训练经验,熟悉SFT、RLHF等方法;
4. 熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5. base 上海,每周出勤天数≥4天,能实习6个月及以上优先。
加分项
1. 在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以第一作者身份发表论文;
2. 参与开发过有影响力的开源项目,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩。
申请
上海
岗位职责
1. 探索Agent系统安全能力,构建基于OpenClaw等开源智能体框架的安全能力系统,研发相应的工具/算法;
2. 研发智能体核心能力,提升语言模型和/或多模态模型在多轮交互、工具调用能力在丰富场景的稳定性与泛化能力;
3. 搭建评测体系,设计Agent能力相关的评测任务和指标,追踪训练效果,驱动训练闭环优化;
4. 将研究成果转化为开源代码,沉淀可复用的智能体安全组件。
岗位要求
1. 本科生及以上学历,计算机科学、数学、统计学或相关专业;
2. 熟悉智能体系统设计,包括 Skills、Memory 等功能模块的设计与实现;
3. 熟悉强化学习基础知识以及大模型后训练技术,熟悉verl等训练框架优先;
4. 熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5. base 上海,每周出勤天数≥4天,能实习6个月及以上优先。
加分项
1. 参与开发过有影响力的开源项目;
2. 在ACM/ICPC,Kaggle等竞赛中取得过优异成绩;
3. 在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文。
申请
上海
岗位职责
在这个岗位上,你将有机会接触并参与到以下一个或多个前沿方向:
1、参与分布式训练架构探索:协助研究与设计下一代大模型训练系统,探索包括数据并行、模型并行、流水线并行在内的混合并行策略。
2、攻坚系统性能瓶颈:参与大模型推理架构与多智能体强化学习探索:协助研究与设计智能推理框架,探索包括P/D分离、Agentic Reasoning、kernel推理加速在内的服务优化策略。
3、研发高效训练工具链:参与开发或优化内部训练框架、性能剖析工具及自动化调度系统,提升平台资源利用率和研发效率。
4、跟踪并实践前沿技术:追踪业界最新技术动态(如MoE、无限上下文、多模态训练等),并尝试将其集成到我们的系统中以解决实际问题。
5、参与开源社区与技术分享:鼓励将研究成果以技术博客、开源代码或学术论文的形式输出,与全球社区共同进步。
岗位要求
1、学历专业:2027届应硕/博士研究生,计算机科学、人工智能、电子工程或相关专业。
2、知识基础:
- 扎实的计算机系统基础,熟悉操作系统、计算机网络、数据结构与算法。
- 熟悉Python/C++等至少一门主流编程语言,具备良好的工程实现能力。
- 了解PyTorch或TensorFlow等深度学习框架的基本原理和使用。
3、良好的团队协作精神:善于沟通,乐于分享,能与团队成员高效协作。
4、至少实习4个月及以上。
加分项(具备以下任一经验者优先):
1、在相关领域的顶级会议(如NeurIPS, ICML, MLSys, OSDI等)或期刊上有论文发表或投稿经历。
2、有分布式系统、高性能计算相关的课程项目、研究课题或实习经验。
3、熟悉MPI、NCCL等通信库,或对CUDA编程有基本了解。-
有活跃的开源项目贡献经历。
申请
上海
岗位职责
1. 负责开发和优化大模型训练系统,使用混合并行、自动并行和通信优化等技术,提高内部模型训练的速度和效率。
2. 设计并实现高效的大模型训练工具,紧跟模型架构的演进,不断优化并行训练策略,以满足公司业务发展的需求。
3. 深入进行大模型训练的性能分析,精准识别并解决训练过程中的性能瓶颈,确保训练效率最大化,充分挖掘硬件资源的潜力。
岗位要求
1. 拥有计算机科学或相关领域硕/博士学历,对分布式系统、机器学习系统有深入的理解和实践经验。
2. 熟悉至少一种编程语言,熟悉PyTorch FSDP、DeepSpeed或Megatron-LM等任一分布式训练框架,有大规模预训练模系统优化经验。
3. 良好的数据分析和问题解决能力,良好的业务理解能力。
4. 在计算机系统领域的顶级会议和期刊发表过发表过论文(优先考虑)。
申请
上海
岗位职责
1、针对特定硬件(GPU/DSA)进行推理和训练场景下算子开发和性能优化,包括DSL扩展,硬件无关优化,流水排布。
2、分析模型性能瓶颈,找出瓶颈算子并进行高性能计算加速和优化,包括计算通信融合,自动融合算子生成。
3、承担国产AI编译器开发,与国产厂商合作支持多后端(GPU/DSA), 并进行相关Pass开发。
岗位要求
1、本科及以上学历,熟悉CUDA/华为昇腾AscendC/triton编程语言。
2、熟悉C++/Python,编程语言基础扎实,熟悉计算机体系结构及操作系统原理。
3、了解深度学习算法,对大模型推理和训练框架vllm, sglang, megatron的应用或开发经验。
4、具备优秀的分析问题和解决问题的能力,至少实习4个月及以上。
加分项(具备以下任一经验者优先):
1、计算机领域相关的编程大赛获奖;
2、熟悉AI领域常见框架、模型,有过实战调优经验;
3、熟悉大模型算法和优化方法、熟悉MLIR, TVM, XLA, LLVM;
4、在国产芯片厂商(寒武纪,璧仞,燧原,华为,沐曦,天数)性能优化经验.
申请
上海
岗位职责
1.参与建设AI算力云原生平台,提供高性能、高稳定性、高易用性加速计算平台。
2.参与 Kubernetes 调度策略定制与批处理调度器扩展开发,支持AI训练任务的优先级管理、资源抢占、弹性伸缩,适配分布式训练的算力调度需求。
3.优化GPU资源全生命周期管理,包括分配、隔离、监控、容错等,结合业务特征设计智能调度策略,平衡算力供给与成本控制。
4.参与大规模 AI 训练任务故障诊断与自愈体系的设计与实现,基于硬件、通信指标监控和事件分析,设计智能告警与根因定位系统,快速识别任务异常并进行故障隔离。
5.在导师指导下探索业界最新技术方向,参与开源社区实践,提升团队云原生 AI 核心竞争力。
岗位要求
1. 计算机/人工智能/软件工程等相关专业,至少实习4个月及以上。
2. 熟悉后端服务开发,熟悉Golang和Python编程语言,有良好的编程规范意识,能独立完成服务接口与交互逻辑开发。
3. 掌握kubernetes基本工作原理,熟悉Volcano、Kubeflow、Argo等相关AI云原生框架者优先;有相关课程设计、项目实践经验者可优先考虑。
4. 有基本的数据检索和分析能力,掌握SQL语法,熟悉时间序列数据库及其查询语言(如PromQL)优先。
5. 对后端开发和分布式系统领域有浓厚兴趣,关注行业技术动态,有持续学习和提升技术能力的意愿。
6. 具有较强的学习能力和问题解决能力,能够快速掌握新技术,独立分析和解决模块开发过程中遇到的问题。
申请
上海
岗位职责
1、低精度计算技术研发:参与 FP8、FP4、MXFP8 等下一代低精度数值格式研发,优化 LLM、Diffusion 等模型在低精度下的训推效率。
2.、超节点集群系统优化:参与超节点(8 卡 +)集群上国产模型的训推任务,结合超节点架构特性(如互联拓扑、存储布局)研究训推加速技术,目标降低节点间通信耗时 30%+。
3、芯片算力与互联适配:分析 NVIDIA、昇腾、寒武纪、海光等芯片的硬件特性(计算单元、存储层次、指令集),定位性能瓶颈并转化为系统优化策略(如算子拆分、数据预取)。
4、存储 - 计算耦合设计:针对千亿参数级模型,设计 “内存 - 显存 - NVMe” 三级存储协同方案(动态数据 offload 策略),解决内存溢出问题,优化存储访问模式(数据对齐、空间局部性利用)。
岗位要求
1、本科及以上学历,计算机、微电子、自动化等相关专业,至少实习4个月及以上;
2、了解芯片硬件架构:深入理解 CUDA Core/Tensor Core/AI Core 等计算单元、L1/L2/HBM 存储层次,熟悉华为 CANN、NVIDIA CUDA 等算子接口,有国产芯片(昇腾、寒武纪)适配经验者优先;
3、熟悉互联与分布式技术:熟悉 PCIe 5.0、NVLink、RoCE 等通信协议,了解 MPI、NCCL、BytePS 等分布式计算范式,有异构芯片集群(如 “NVIDIA GPU + 昇腾 910”)优化经验者优先;
4、具备存储优化能力:有 AI 负载存储层级优化经验,能设计大规模模型的动态 offload 策略,解决超大规模训练内存问题者优先;
5、结果导向:能快速定位系统性能瓶颈,推动技术方案落地,有低精度计算或超节点系统项目经验者优先。
申请
上海
岗位职责
1、设计制定AI芯片评测方案,包括功能、性能、稳定性等全方位指标,覆盖训练、微调、推理等多个应用场景,满足内外评测需求。
2、掌握主流模型底层算法原理,持续跟踪技术发展趋势,结合工程实践不断完善评测指标和评测方案。
3、根据评测方案进行基准值采集,完成后续评测方案答疑沟通和评测数据验证工作,编写相关测试和分析报告。将以上评测流程自动化,参与评测平台建设。
4、参与芯片评测领域相关标准编写,对外沟通等影响力建设工作。
岗位要求
1、电子工程、计算机科学或相关专业本科及以上学历。有AI芯片评测经验优先,实习4个月及以上。
2、熟悉深度学习框架,熟悉AI芯片的体系结构,精通性能测试工具和方法。有大模型实际训练、微调、推理应用、部署经验者优先。
3、良好的团队协作和沟通能力。
申请
上海
岗位职责
1. 研究大语言模型关键技术,包括但不限于数据筛选、数据合成、模型训练、价值对齐、评测方法等;
2. 构建高质量大语言模型数据集,包括评测集、sft数据、RL数据、pretrain数据等;
3. 参与关键项目,完成项目中的部分工作内容,践行实践能力,掌握一手大模型训练经验;
4. 跟进与探索前沿技术,创新大模型关键领域算法研究,发表顶会顶刊论文。
岗位要求
1. 本科在读及以上,计算机/人工智能/模式识别等相关专业;
2. 熟悉掌握机器学习和深度学习相关理论和方法;
3. 熟悉LLM前沿技术,有LLM微调、评测、开发等经验者优先;
4. 熟练掌握Python,熟悉Pytorch、transformers等常用工具,熟悉常用数据结构及算法;
5. 每周工作至少4天,实习至少4-6个月;全职实习者优先;
6. 工作地点:上海市徐汇区国际传媒港/北京市海淀区理想国际大厦。
申请
上海
岗位职责
岗位职责
1、模型推理加速优化:聚焦文档解析大模型推理过程,运用主流框架(如 MMDeploy、vLLM)及模型量化等方案,在保障推理效果的同时,显著提升模型推理速度。
2、数据研究与模型迭代:与模型训练团队密切协作,负责文档解析大模型迭代时的数据扩充和更新,助力模型能力持续提升。
3、学术与开源贡献:积极参与开源项目发布及顶会论文发表,开展具有实际价值的工作。
岗位要求
任职要求
1、教育背景:硕士及以上学历,博士优先;专业需为计算机视觉、自然语言处理、多模态、机器学习等相关领域。
2、技术能力:具备较强的动手和编程能力,熟练掌握 Python 与 Pytorch 深度学习开发框架;有 GitHub 热门项目经验者优先考虑。
3、学术与实践经验:对大模型算法有深入理解,有相关顶会论文发表或高水平竞赛获奖经历者优先。
4、综合素质:拥有良好的沟通表达、团队协作能力,具备攻克关键技术难题的能力和一定抗压能力。
5、实习要求:实习时长不少于 5 个月,每周出勤 5 天,长周期实习生优先。
申请
上海
岗位职责
岗位职责:
1. 参与实验室书生·浦语大语言模型(InternLM)数据集构建和算法研发工作,构建新一代高质量的大型语言数据集。
2. 探索如何从互联网网页中有效地抽取数据并且最大限度保留原始网页的结构信息。
3. 构建Data-Centric数据闭环,建立数据抽取-清洗-评估一体化pipeline。
4. 持续关注最新研究动向,鼓励在高质量会议及期刊上发表高水平论文,打造和提升行业技术影响力。
岗位要求
任职要求:
1. 计算机/数学/统计学/模式识别等相关专业,专业方向为自然语言处理、计算机视觉、多模态、机器学习等。
2. 具备扎实的数学功底和工程能力。熟悉和掌握机器学习和深度学习相关理论和方法。
3. 有敏锐度的研究sense,能够结合现有项目基础和前沿大模型技术。
4. 具备良好的沟通表达能力、团队协作意识、针对关键技术难度的攻坚能力。
加分项:
1. 在ICLR、ICML、Neurips、ACL、EMNLP、CVPR等顶会或者顶刊上以一作身份发表过学术论文。
2. 获得过高水平竞赛优异成绩者。
3. 以核心开发者参与过知名开源项目。
4. 对HTML有深入了解,熟悉markup语言的特性。
申请
上海人工智能实验室 未融资 上海
上海人工智能实验室 2020 年 7 月揭牌成立,是我国人工智能领域新型研发机构,聚焦战略性、原创性、前瞻性研究。实验室汇聚全球顶尖科研力量,由汤晓鸥、周伯文等学者领衔,构建 “连接器、放大器、加速器” 三器生态。自主研发 “书生” 大模型体系,包括 InternLM 通用大模型、Intern-S1 科学多模态大模型,推出书生・浦语、书生・天际等系列产品。2025 年联合发布十项 “AI + 科学” 突破性成果,覆盖量子计算、生命科学、材料科学等领域。实验室打通基础研究到产业落地全链路,孵化相风科技等企业,推动 AI 技术在气象、医疗、航天等领域应用,是中国人工智能创新发展的核心策源地。