智谱 GLM预训练 二面
询问项目:
预训练数据清洗流程
爬虫数据来源
数据挖掘流程
继续预训练策略选择
评测集是怎么合成的
数据配比对模型能力的提升
大模型与小模型之间的scaling law
图文模型怎么收集数据,怎么制作评测集,怎么数据增强
八股问了
1F1B的流程,解决了dreampipe什么问题
microbatch的意义
空泡时间怎么算
zero123的区别
如果是3D并行zero最多开多少,如果开到2会怎么样
他们好像很想要提前实习,从一面到二面一直在提。
一天后约HR面。
#牛客创作赏金赛#
预训练数据清洗流程
爬虫数据来源
数据挖掘流程
继续预训练策略选择
评测集是怎么合成的
数据配比对模型能力的提升
大模型与小模型之间的scaling law
图文模型怎么收集数据,怎么制作评测集,怎么数据增强
八股问了
1F1B的流程,解决了dreampipe什么问题
microbatch的意义
空泡时间怎么算
zero123的区别
如果是3D并行zero最多开多少,如果开到2会怎么样
他们好像很想要提前实习,从一面到二面一直在提。
一天后约HR面。
#牛客创作赏金赛#
全部评论
跟并行训练杠上了啊
想问一下这个应该怎么答呀,谢谢:如果是3D并行zero最多开多少,如果开到2会怎么样
请问一面和二面之间相差几天?面试不满意的话会有通知吗?谢谢
相关推荐
02-25 16:29
齐鲁工业大学 golang
找工作勤劳小蜜蜂:自我描述部分太差,完全看不出想从事什么行业什么岗位,也看不出想在哪个地区发展,这样 会让HR很犹豫,从而把你简历否决掉。现在企业都很注重员工稳定性和专注性,特别对于热爱本行业的员工。
你实习的工作又太传统的it开发(老旧),这部分公司已经趋于被淘汰,新兴的互联网服务业,比如物流,电商,新传媒,游戏开发和传统的It开发有天然区别。不是说传统It开发不行,而是就业岗位太少,基本趋于饱和,很多老骨头还能坚持,不需要新血液。
工作区域(比如长三角,珠三角,成渝)等也是HR考虑的因素之一,也是要你有个坚定的决心。否则去几天,人跑了,HR会被用人单位骂死。 点赞 评论 收藏
分享
03-12 11:56
广西艺术学院 项目助理 点赞 评论 收藏
分享
