阿里云数据库事业部PolarDB for AI实习生招聘开始啦~欢迎勾搭呀~

内推码:XN402U

阿里云 PolarDB for AI 团队校招实习生招聘 | 让海量数据“开口说话”,做AI时代智能数据库的造浪者!
现在的你,可能正在实验室里反复调试模型,在算法题海里寻找最优解,或者为第一个跑通的项目暗自兴奋。你离“真正影响千万人生活”只差一个真实的战场。
想象一下:数据正在感知物理世界的万物。海量图片、视频与传感器数据,在这里被转化为毫秒级可查的“数字记忆”。你车子的智驾系统可能正在调用它;你每天在玩的游戏、刷到的新闻和视频推荐、金融分析师问出的业务报表,背后可能都在使用我们的产品能力。依托阿里云 PolarDB 的海量数据,通过in-DB AI模型算子,我们专注让 AI 与数据库的碰撞,直接跑进千万用户的真实场景里。
无论你是算法、内核研发还是全栈工程背景,只要你对“让数据自己说话”有执念,这里都有你能主导的模块和能落地的想法。在这里,“快速成长”与“被看见”是确定性的;只有带明确目标的实战,没有黑盒流程;只有我们一起逐行 Review 代码、1v1 对齐技术路线,在千万级 QPS 的真实洪峰中验证你的想法。你的每一行代码,都会直接改变产品的体验边界。
2027 届的同学,欢迎来聊聊。

岗位要求:
1.基础条件
● 计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制。
● 有顶会论文(ACL/EMNLP/ICLR/NeurIPS/ICML等)/高影响项目/开源贡献者加分。
2.专业能力
● 模型与后训练:解Transformer/LLM模型架构、演进原理与局限;具备SFT/DPO/RL等后训练与迭代能力(含数据/评估/优化),对后训练算法有实践经验和深刻认知;拥有Agentic RL训练实操经验者优先。
● Agent与系统编排:能做任务拆解与多Agent协作;熟悉RAG、Memory、Tool-Use(含MCP/类协议/Skills等)并能工程化落地;独立开发过具备一定影响力AI应用者优先。
● 数据构建:具备Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实践经验者优先。
● 评测与交付:能搭建评估闭环(autorater/LLM-as-judge、离线评测、A/B);具备测试、调试、review、安全/隐私与质量门禁能力;能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先。
● 工程与系统素养:能够通过Vibe Coding快速构建项目原型;理解分布式系统/数据库/计算机系统基础;精通至少一门语言,熟练掌握Python与Pytorch;熟悉Git/命令行;了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed/FSDP等),有分布式训练/大规模数据处理经验(Hadoop/MaxCompute等)加分。
3.能力特质
● 学习力:对AI有热情、对前沿技术与产品好奇,对未知开放,能举一反三。
● 动手能力:积极主动体验市场中先进的模型和产品,独立阅读论文/技术报告等并快速复现,快速主动尝试落地先进开源项目,对主流AI开源项目有贡献者优先。
● 技术审美:对新技术有近乎本能的渴望,能区分“能跑”与“优雅”,追求简洁、可维护、可扩展;在模型/框架/工具选型上保持高信噪比决策。

加分项(非硬性门槛,但会让你脱颖而出):
1、有数据库内核(MySQL/PG/PolarDB 等)或 AI 推理/训练框架优化经验;
2、熟悉向量检索引擎、多模态大模型微调或 RAG/Agent 架构,有从 Demo 到生产环境落地的完整经历;

• 简历请发至:【**********】(技术同学直接接收哦),站短不常看~
• 邮件标题注明:姓名-学校-27届校招

求贤若渴,期待与你,一起造浪。

#阿里巴巴# #实习# #27届# #暑期实习# #阿里内推##牛客AI配图神器#
全部评论
有笔试吗
点赞 回复 分享
发布于 04-10 11:30 浙江
这个岗位主要是需求产品开发,还是前沿研究性质的?
点赞 回复 分享
发布于 04-10 11:26 浙江

相关推荐

04-24 16:42
已编辑
南京林业大学 后端工程师
发面经攒人品前几天面的,一直卡审核发不出来,今天重发太难了,被疯狂拷打1. 自我介绍2. 实习干了什么3. 实习的时候怎么修复bug的4. 实习的时候数据库、redis用的集群吗?5. 你觉得微信推送功能是怎么做的?是依赖于每个手机厂商提供的push服务吗?还是说每个app只接受其服务端的push?(完全不会)6. 实习的时候,你怎么写代码那,有没有开发机,怎么测试?怎么发布?日志怎么看?7. agent项目的向量数据库用的什么?你了解这个向量数据库内部怎么存储的吗?你怎么部署的这个向量数据库?(底层原理不知道)8. 你有没有自己开发过mcp?(没有)9. react模式是什么?10. 你这个agent做完后最后是一个什么形式?11. 你是用了spring ai alibab里面封装好的吗?是不是就调用了几个接口?12. rag切片怎么做?13. 有没有测试过准确率和召回率?(没做)14. 你主要是java吗?有没有用过其他语言?15. 讲一下synchronize关键字16. synchronize关键字锁的到底是什么?17. 讲一下synchronize的底层原理18. 你知道锁监视器对象是怎么用的吗?线程怎么抢锁?19. 有很多线程,他们怎么抢这个锁,能不能讲一下具体过程?20. 堆怎么管理?怎么回收垃圾?21. 你了解协程吗?(不知道)22. 讲一下输入qq.com到最后显示页面的过程23. HTTPS握手具体怎么做?24. (从这里开始抽象起来了,面试官一直问我ECDHE的会话密钥怎么计算,私钥怎么计算,怎么交换公钥,我完全不知道,之前背的小林coding,我感觉他好像认为小林coding上的是错的,然后一直追问,我压根听不懂他问的到底是什么意思)25. 客户端和服务器要交换公钥,这些公钥要用来干什么?26. 这个会话密钥到底是怎么协商的?讲一下具体过程27. 客户端和服务器交换的到底是什么?28.  此处省略一堆,全是问这个怎么公钥生成的,怎么交换,为什么这样能行,怎么计算会话密钥的,我完全听不懂面试官想问什么29. 讲一下大模型的工作原理(到这里已经彻底绷不住了,我明明投的是后台开发啊)30. 你不觉得这很神奇吗?他为什么根据上下文就能回答?反问:1. ECDHE那里到底是什么?- 你混淆了很多概念,比如随机数、私钥、公钥。随机数不能用来直接做私钥,你去问一下gpt。(但是小林coding上说那个随机数就是私钥)2. 到底是做什么业务的- 做存储和下发。数据要处理后再存储,然后用户访问时下发。最后面试官说了一句“感谢你参加腾讯的面试”。🤡
查看28道真题和解析
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务