字节应用一面
应该是某部门里的算法团队,有大模型相关的
1.自我介绍
2.项目详细拷打
3.长记忆这块除了 rag,你们有试过长文本模型吗?为什么不好?你们使用的扩充到 32K 的模型还是预训练本身就 32K 的模型?
4.你们记忆检索怎么检索的?有做什么优化吗?
5. 有没有了解过 loss in middle?(应该是这个?应该是说中间的注意下降吧?不是很懂这个原理)
6.DPO PPO 能讲一下它们的区别吗?有没有了解过更前沿的 RLHF?
7.DPO 里你刚刚说的 reject chosen 的 loss 里的概率是怎么计算的知道吗?
8. 简单讲讲 transformer bert 一类的模型的结构吧。
9.attention 公式是什么?为什么要除以根号 dk?
10. 你们模型效果怎么评估?上线有具体准确率之类的要求吗?
11. 安全对齐这块,你们有做样本分布统计吗? 就是具体涉及到哪些类?
代码题最大乘积连续子数组
1.自我介绍
2.项目详细拷打
3.长记忆这块除了 rag,你们有试过长文本模型吗?为什么不好?你们使用的扩充到 32K 的模型还是预训练本身就 32K 的模型?
4.你们记忆检索怎么检索的?有做什么优化吗?
5. 有没有了解过 loss in middle?(应该是这个?应该是说中间的注意下降吧?不是很懂这个原理)
6.DPO PPO 能讲一下它们的区别吗?有没有了解过更前沿的 RLHF?
7.DPO 里你刚刚说的 reject chosen 的 loss 里的概率是怎么计算的知道吗?
8. 简单讲讲 transformer bert 一类的模型的结构吧。
9.attention 公式是什么?为什么要除以根号 dk?
10. 你们模型效果怎么评估?上线有具体准确率之类的要求吗?
11. 安全对齐这块,你们有做样本分布统计吗? 就是具体涉及到哪些类?
代码题最大乘积连续子数组
全部评论
是被捞的还是主动投的呀 等了几天被捞呢
今天刚通知我这个部门的三面过了
uu反问有仔细问相关业务吗

蹲一下是不是kpi 我也被捞起来了
相关推荐
07-21 09:33
门头沟学院 客户端其它 
点赞 评论 收藏
分享
点赞 评论 收藏
分享
07-22 15:24
广西师范大学 大数据开发工程师 上周偶然刷到了lls的26秋招提前批开了,主包前段时间从字节实习完,秉持着投着试试的心态,认真填写了秋招的网申,提交成功的下一秒再刷新应聘页面,已经变成流程结束好夸张!是不是被机筛了,终究是双非不配了

点赞 评论 收藏
分享