潞晨科技大模型一面

45分钟

潞晨科技是做colossal AI的那个公司

面试官base 新加坡

团队介绍:
主要做的是训练框架,包括STF、RLHF、长文本、数据处理、MOE、模型评估。
团队人很少,主要base新加坡和上海。

不是核心的colossal ai,那个有同学在,做分布式训练

面试官上来之后看了一遍简历,说跟他完全不是一个方向,所以主要是我在介绍我的工作。从实习开始介绍,中间有问题会打断。

介绍完之后,面试官根据自己知道的结合简历一点一点提问。

对diffusion model的理解,为什么要diffusion,怎么扩散的?

为了下微调方法,知道哪些adapter微调,有什么区别?lora是怎么实现的,讲下细节。

layer norm和batch norm的区别,为什么nlp用layer norm比较多?

问平常用transformers库多不多,写torch多不多…

其他的记不起来了。

算法题是leetcode 221 最大正方形,要求必须python写
全部评论
佬,拿offer了吗,潞晨科技咋样啊
点赞 回复 分享
发布于 2024-08-05 16:21 山东
持续跟踪
点赞 回复 分享
发布于 2024-04-18 16:39 安徽

相关推荐

10-22 15:25
门头沟学院 C++
种花网友小松:求求你别发了,我几乎都快嫉妒得疯了,倒在床上蒙住被子就开始抱着枕头尖叫流泪,嘴里一边喊着卧槽卧槽,一边又忍着,我边发边哭,打字的手都是抖的,后来我的手抖得越来越厉害,从心头涌起的思想、情怀和梦想,这份歆羡和悔恨交织在一起,我的笑还挂在脸上,可是眼泪一下子就掉下来了。求你了别发了,我生活再难再穷我都不会觉得难过,只有你们发这种东西的时候,我的心里像被刀割一样的痛,打着字泪水就忍不住的往下流。
我的求职进度条
点赞 评论 收藏
分享
评论
1
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务