阿里大文娱优酷大模型一面

阿里大文娱优酷,没做笔试直接约面试。
1.自我介绍
2.实习经历
训练数据有哪些组成部分?
每一个样本是只有一句话参与训练还是都参与?
用的什么训练框架?
SFT 的过程中有没有遇到什么困难?
你们这个流程中,有需要人力评估吗?在哪一部分?
多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗?
流水线并行了解吗?
你们训练的时候学习率怎么调的,用不用 warm up?
还有一些忘记了

智力题:10 个字的句子,最多能分成多少种分词?(实际上很简单,就是 10 个词中间 9 个空,分割过不分,2 的 9 次方。 我硬是用递归公式推了半天)

代码题: 给一个数 N,一个长度 L。 求一个非负整数连续序列,序列和等于 N,长度不小于 L。 多个答案的话要输出最小的长度。(有一些数学计算)

反问业务:做剧本辅助的大模型
面试官迟到五分钟进来说还在开会让我等一会。等了 30 分钟+面试 90 分钟,整体两个小时没绷住 hhh。 
全部评论
感觉是同一个面试官,完全一样的智力题和代码题,智力题我直接找规律把面试官看乐了
1 回复 分享
发布于 2024-09-05 06:18 美国
大佬oc了吗
点赞 回复 分享
发布于 2024-10-23 20:49 陕西
有大佬想来我们这吗 帮推
点赞 回复 分享
发布于 2024-09-03 22:02 上海
听里面的人说这个组挺不错的 可以冲
点赞 回复 分享
发布于 2024-09-03 21:40 北京
佬提前批流程过完了吗
点赞 回复 分享
发布于 2024-09-03 21:30 重庆
我看官网没有在招岗位 你啥时候投的
点赞 回复 分享
发布于 2024-09-03 21:11 北京
请问sft微调遇到什么困难怎么回答呀
点赞 回复 分享
发布于 2024-09-03 18:45 北京

相关推荐

07-01 22:23
已编辑
字节跳动_实习生(实习员工)
1.简单的自我介绍2.八股和项目C++ 相关怎么获取一个变量占用的内存的大小?如果你对一个指针用 sizeof,它的返回值是什么?如果是对普通的指针使用 sizeof,它的大小是多少?方法的签名包含哪些部分?用过 C++ 的模板编程吗?在模板编程里面,为什么会要求你把模板的声明和实现都放在头文件里面?了解这个模板是怎么实现的吗?它的原理是什么?操作系统与多线程/多进程项目中的互斥锁是可重入的吗?了解过可重入锁和不可重入锁吗?请介绍一下自旋锁。自旋锁会有额外的性能损耗吗?你了解内核态和用户态的情况吗?内核态和用户态,是怎么实现隔离的呢?进行系统调用的时候会发生什么?子进程它怎么和主进程去交互呢?除了管道,还有其他进程间通信的方式吗?进程和线程有什么区别?进程之间的内存是共享的吗?有没有接触过线程之间不共享内存的语言?数据库与网络了解 Protobuf (PB) 吗?为什么(在你的项目中)使用 SQLite 而不是 MySQL?你的项目中有用索引吗?请介绍一下数据库索引。3.手撕:有序数组查找范围(两次二分查找)4.反问面试流程大概要多久?什么时候能知道结果?面试官年轻了点,人还是很友好的,不懂的也不会一直追问,对项目的提问还是有一定深度的,答上来了大概70-80%。
查看24道真题和解析
点赞 评论 收藏
分享
评论
9
31
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务