阿里大文娱优酷大模型一面

阿里大文娱优酷,没做笔试直接约面试。
1.自我介绍
2.实习经历
训练数据有哪些组成部分?
每一个样本是只有一句话参与训练还是都参与?
用的什么训练框架?
SFT 的过程中有没有遇到什么困难?
你们这个流程中,有需要人力评估吗?在哪一部分?
多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗?
流水线并行了解吗?
你们训练的时候学习率怎么调的,用不用 warm up?
还有一些忘记了

智力题:10 个字的句子,最多能分成多少种分词?(实际上很简单,就是 10 个词中间 9 个空,分割过不分,2 的 9 次方。 我硬是用递归公式推了半天)

代码题: 给一个数 N,一个长度 L。 求一个非负整数连续序列,序列和等于 N,长度不小于 L。 多个答案的话要输出最小的长度。(有一些数学计算)

反问业务:做剧本辅助的大模型
面试官迟到五分钟进来说还在开会让我等一会。等了 30 分钟+面试 90 分钟,整体两个小时没绷住 hhh。 
全部评论
感觉是同一个面试官,完全一样的智力题和代码题,智力题我直接找规律把面试官看乐了
1 回复 分享
发布于 2024-09-05 06:18 美国
大佬oc了吗
点赞 回复 分享
发布于 2024-10-23 20:49 陕西
有大佬想来我们这吗 帮推
点赞 回复 分享
发布于 2024-09-03 22:02 上海
听里面的人说这个组挺不错的 可以冲
点赞 回复 分享
发布于 2024-09-03 21:40 北京
佬提前批流程过完了吗
点赞 回复 分享
发布于 2024-09-03 21:30 重庆
我看官网没有在招岗位 你啥时候投的
点赞 回复 分享
发布于 2024-09-03 21:11 北京
请问sft微调遇到什么困难怎么回答呀
点赞 回复 分享
发布于 2024-09-03 18:45 北京

相关推荐

1假设一个队列需要删除其中一个节点,应该怎么去操作它?2那你是调用这个链表它本身提供的接口吗?那它该接口的底层大概是怎么实现的?3二分查找法,如果要计算时间复杂度,应该怎么去计算?4了解快排的时间复杂度应该怎么计算?5它的这个计算的复杂度,是稳定性的吗。6假如说有一连串的计算表达式1+ 2 * (3 + 5)/ (6 + 3)。这样的计算表达式,要计算它的数学结果,这个我应该怎么去做?7要把10进制转成 16 进制,是一个什么样的思路啊?8假设三维空间中有很多个点,假如说有 10 万个点,需要求距离最近两个点的坐标,我应该怎么去做?9地铁站的这些站点信息,打算怎么去存? Java 里面用什么样的数据结构去存这个这条线路?还有这个站点?假如以地铁站为例,有 2 号线、 1 号线,然后 1 号线有什么站点? 2 号线有什么站点?10面试官提示了用链表存储。继续问:那当你存了之后,怎么去做深度优先遍历啊?11假如说功能上线之后,我的用户访问量比较大,有 20 万用户同时去访问。那这时候我的查询、计算就会比较慢,我应该怎么去做相应的优化?●来不及改程序,直接加硬件资源●加缓存,直接带来性能优化●算法层面的优化12多个进程之间的通信方式会包括有哪些?13Redis 能简单说一下读写的流程吗?14假设redis集群三主三从,那节点是怎么去做选择的?怎么知道当前这个 key 是发到 a 节点还是这个 k 发到 b 节点,是一个什么样的策略?15实习的话是希望对自己有一个什么样的期望或者目的?
点赞 评论 收藏
分享
评论
9
29
分享

创作者周榜

更多
牛客网
牛客企业服务