淘天大模型训练-暑期实习(可转正)

团队致力于打造核心LLM算法能力和应用技术,为了更好服务淘宝电商场景业务。如果你对LLM技术有思考和热情,欢迎投简历。你会接触和探索最前沿的LLM技术,有丰富资源和强大基建支持。

简历投递:https://huggingface.co/maidalun1020

职位描述:

1、探索模型结构、数据和pretrain/continue pretrain 训练方式,对LLM基座电商领域注入知识,提升基座能力;

2、跟进和探索最新的sft/RLHF技术,提升垂直场景效果,减少幻觉,增强推理能力;

3、探索新框架、数据构造和训练方式,包括但不限RAG/agent框架,提升复杂问题解决能力;

职位要求:

1、985、211计算机相关专业,本科及以上学历;

2、有pretrain/sft/RLHF之一相关经验;了解RAG/Agent常见应用框架和算法原理;

2、基于Deepspeed,Megatron等框架,跟进最新算法效果和探究实验;

3、优先项:发表过高水平会议或期刊论文;高star开源项目重要贡献者

#淘天实习##大模型算法#
全部评论

相关推荐

头像
04-15 11:25
已编辑
河海大学 Java
#牛客AI配图神器# 还是电话面 无手撕面试官非常专业,提出了很多我听都没听说过的东西,只能说还是太菜了不配面淘天不愧是淘天偏核心的部门(商品库存相关),被拷打的要哭了全程压力拷打,全程非常规八股,全程场景题 我声音最后都在颤抖问的全是JUC和消息队列,刚好是我最薄弱的两个点,直接被击穿了1.自我介绍2.RAG和普通检索有什么区别么?3.模型相关?了解过过openManus么?4.你怎么理解MCP?5.ZSET的数据结构?介绍下跳表?跳表的元素插入?6.对比下B+树和跳表?各有什么优缺点,为什么redis不用B+树?为什么mysql不用跳表?//说了B+树叶子节点是双向链表直接被打断,你确定是双向链表么?//拷打后,最后告诉我双向链表是InnoDB的优化,不是B+树本身的实现7.为什么用redis的哨兵模式?为啥不直接用集群模式?8.简单介绍一下caffine的本地缓存她有什么特点么?9.你有没有遇到数据不一致的情况?简单介绍canal的实现原理?10.简单介绍一下Mysql的主从复制的流程?Binlog里面记录的是日志还是数据?//噩梦开始了好多是我这辈子都没见过的题11.rabbitmq有什么特点?发布订阅的模式是推还是拉?怎么保证消息是顺序的执行的?12.十个消费者监听队列,设置了顺序执行,有执行一个异常了,这种情况下怎么处理呢?怎么保证顺序性?13.有一个消费没消费掉,卡住了,其他的消费者还会正常消费么?14.模拟一个下单的场景,超过时间自动释放,你来设计一下?消息清除还是放到死信队列?15.放一条10s过期的后在放一条5s过期的,5s的会先于10s的进入死信队列么?16.分布式环境中的一致性怎么了解的?有了解过CAP么?(我简历都没写你为什么要问)17.我问你!我给你个场景!我有十批任务,每批任务有10个子任务,我希望子任务是并行执行的,但是在外面十批任务是串行执行的,你有什么设计思路么?18.你有了解过JUC中关于线程调度的工具类么?19.那你介绍下CAS吧?哪些关键的对象通过CAS进行实现或者优化的?拷打结束1.你学校在哪里?对工作地有什么要求么?杭州是ok的么?2.除了阿里还面过其他的么?(已经被拷打麻了,脑子转不动,全都如实招了,第一次感受到无力感)?还在流程中的有哪些?3.有拿到过offer么?还有啥在流程当中么?(可能怀疑我太菜了,没啥可信度)4.其实我看你的项目当中用的技术,还是比较喜欢去了解的,但是我希望你在用的时候去更深入的了解?5.其实也可以理解,毕竟你是学生阶段,也没啥并发量,如果在淘天大量级的情况会有很多问题出现,还是要深入了解本周第一寄消息队列是速成的,根本没接触过这么多功能,我在项目中也只是用了个异步调用解耦,为什么要这么拷打我啊后续:估计是压力面,已经约了三面
查看24道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务