阿里云研究型实习生招聘-多模态大模型

阿里云智能 - 大数据和智能实验室 - 多模态大模型方向 - 招收研究型实习生(Research Intern)

职位:多模态大模型研究型实习生
方向:multi-modal representation / alignment / reasoning / post-training等相关方向
地点:杭州

【方向介绍】
阿里云智能-大数据和智能实验室招收多模态大模型方向的研究型实习生(Research Intern),多模态大模型(Large Multimodal Models,LMMs)作为当前学术界与工业界的研究热点,近年来已经取得了不错的发展,但在相关方向的基础研究和落地应用上,仍然有很多亟待解决的技术难题。团队专注于多模态大模型方向,重点聚焦全模态大模型、多模态表征学习、跨模态对齐、视觉理解和生成、多模态推理等相关核心技术领域,在解决多模态大模型实际落地问题的过程中,同步开展相关方向基础性的研究,欢迎对多模态大模型相关技术方向感兴趣且具备一定基础的同学一起加入。
【团队大咖】
叶杰平,阿里云集团副总裁,美国密歇根大学终身教授,IEEE Fellow,ACM杰出科学家。机器学习、数据挖掘与大数据分析领域国际领军人物,论文引用4万余次,h-index 104,多次获得顶会最佳论文。
【职位描述】
研究型实习生(Research Intern),目标是开展原创性研究,在NeurIPS/ICML/ICLR/CVPR/ICCV等顶级会议期刊上发表高水平论文;
【职位要求】
1. 对多模态大模型相关技术方向感兴趣或有相关经验;
2. NLP、计算机视觉、多模态、机器学习、深度学习等相关背景,27/28/29届硕士/博士毕业生;
3. 具备很好的自驱力,对新事物有好奇心,有良好的分析、解决问题能力、coding能力和团队协作能力,可长期实习;
4. 有NeurIPS/ICML/ICLR/CVPR/ICCV 等相关领域论文发表经历的同学优先。
有感兴趣的同学,欢迎联系,联系方式:jiashen.hjs@alibaba-inc.com,有任何问题也可以留言咨询!
全部评论

相关推荐

06-05 22:16
已编辑
门头沟学院 Java
项目拷打: 1. 遇到的最大困难?是怎么解决的?2. 行人重识别算法的技术选型,是否要训练,怎么创新的?3. 聊一下docker,你是怎么理解docker的4. Dockerfile, docker compose1. 秒杀实现过程2. 讨论订单id的生成(答时间戳+当日订单数,问高qps下时间戳应该用毫秒级?微秒级?又答还可以通过uuid这样的自动生成算法)3. 秒杀的优惠券是存在哪里的?缓存预热4. 你这个redis消息队列出来的订单为什么在异步下单的过程中还要判断是否是同一用户?(答消费者组可以重复消费,讨论也可以一个消费者为一组,保证同一条消息只被同一个线程消费)(反问那你在这里用消费者组是不是不合适)5. 是用同一个lua脚本吗?如果高qps,怎么保证库存一致,怎么下单?不是很懂,大概意思是多台服务器同时下单6. RabbitMQ八股:1. redis里面还有哪些数据结构?分别适用于什么场景2. redis高可用怎么实现?主从+哨兵3. redis集群模式下怎么保证数据一致?4. springboot开启事务的方式?(@transactional 和什么,不知道)5. spring事务的底层原理(提示aop)6. spring是支持循环依赖的吗?7. rpc了解吗?rpc使用的协议知道吗?8. 垃圾回收g1的特点9. mysql四种隔离级别10. 幻读和脏读的区别?11. 如何防止幻读?12. 单库、分库、主从库三者的关系、各自缺点13. 有用过什么阿里云的产品吗?oss和百度网盘的区别在哪里(提示oss的名字 对象序列化啥的)14. 监督学习 无监督学习 强化学习的区别15. 在你训练的过程中遇到过什么报错?口述算法题:二叉树叶子节点的公共祖先
查看26道真题和解析
点赞 评论 收藏
分享
四月中旬才开始投递,总算是抓住了暑期的尾巴time line如下:4.15投递5.6一面5.7二面5.8三面512收到offer(一周速通三面,感觉可以挑战全网最快流程)一面(技术面):约80分钟1. 自我介绍2. 详细盘问了科研论文的项目(深度强化学习方向),问的非常详细,包括论文的主要创新点、具体的建模细节等,非常刨根问底,几乎每个设计都要问一下为什么,其中也交叉问了一些八股,主要是强化学习方面的,如loss如何计算与传递等。常规问题以外,面试官还进行了一些拓展,比如让我思考这个科研项目距离落地还需要做哪些工作,多目标的奖励权重如何更新等,这部分我答的不好,但是面试官也非常耐心,一步步引导我去进行思考,也和我交流了他们实际业务中应用强化学习的一些设计。3. 然后又盘问了在滴滴做的项目,这个主要是大致介绍了业务的背景、项目的目标、模型选型的考虑等。其中具体问了一些推荐系统模型的八股(因为简历里有写),如w&d、deepfm、d&c network等的模型特点。4. 面试官介绍了下组里的一些业务,以及如果我能进来的话可以做的一些方向,涵盖的内容非常广,从传统运筹的路径规划到强化学习再到营销用增方向。由于项目和业务上聊了很多,导致没时间手撕,面试官就让我自己截图回去做,做完微信发给他即可。手撕的题是一道力扣mid,最佳股票策略。二面(技术面):约40分钟一面结束后立刻发来了二面通知,第二天上午十一点有趣的是,大概当天十点半的时候,二面还没开始,三面的链接就已经发来了1. 自我介绍2. 滴滴实习项目盘问,问的也很细,跟一面的问题有一些重叠,还问了业务中如果遇到没出现的特征应该怎么处理等数据预处理的问题3. 科研论文盘问,dtw距离是什么,如何计算?k中心聚类的步骤,都是一些常见的八股4. 手撕:力扣mid 编辑距离,发现美团很喜欢出动规题5. 业务介绍,一面时介绍的已经比较仔细了,也没什么需要反问的三面(hr面):约20分钟都是一些开放性的问题,开始侃侃而谈1. 经过前两轮面试,对业务有什么了解?2. 平常有没有用过业务相关的产品?体验怎么样?有哪些痛点?3. 如何利用ai来辅助进行业务升级?举几个具体的场景4. 简历中最能体现自己能力的项目是哪个?具体展开说明5. 过去的几段实习经历里,给自己带来最大改变的是什么?带来了哪些改变?6. 反问
查看16道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务