一面&二面(10.15)→ HR面(10.17)→ 三面(10.22)一面&二面:预训练数据怎么收集的分布式爬虫和清洗用的框架和数据库是什么分布式爬虫有没有做负载均衡分布式清洗有没有遇到爆内存的问题微调/评测数据怎么做的合成数据对模型能力的影响Qwen2-72B base的seq_len是多少,做完yarn之后呢?学习率变化的设计方式和原因继续预训练后模型通用能力变化大型集群出现坏点以后如何快速找出推荐两篇最近读的论文HR面:秋招情况对贝壳业务了解情况大模型/AI对贝壳业务增长点在哪考研情况……三面:秋招情况个人性格拿到oc的企业排序好像今天开始开奖了?三面后到现在一直是offer评估,许愿一下