京东技术一面大模型

一面 HR,这是二面,技术一面。
面试官人很好,聊了很久,总结一下问题吧。
1.自我介绍
2.项目介绍
3.你这个 prompt 是怎么调整的?
4.你如何评估你们这个效果呢?(我从数据评估和模型评估两方面讲)
5.你们的训练数据怎么构造的?用的什么格式?
6.全参微调训练一次多久?
7.主要是 SFT 吗?没考虑强化学习?
8.你觉得为什么现在大模型都是 only decoder?有什么好处?
9.lora 做过吗?讲一下原理
10.lora 你对哪些层次加 adapter?怎么定的?print model 看吗?(面试官后面说对不同层加 lora 效果影响还蛮大的,不仅仅是参数大小)
11. 对训练精度了解吗?(fp16 bf16 我讲的不太对,这部分不是很记得了,要复习一下)
 12.attention 里面的注意力分数是什么?为什么要 Q 乘以 Kt?什么含义?
13. 位置编码了解吗?讲一下

代码题:类似于 topk 但是不要求复杂度,更像是数据处理场景题。
反问:聊了很多,面试官人确实很好,泪目。只能说面试确实看缘分。
全部评论
我勒个豆,咱俩好像一样,我二面也是这个岗
点赞 回复 分享
发布于 2024-08-30 13:53 山西
东子一面是HR面么,为什么邮件通知一面都安排到了10号了
点赞 回复 分享
发布于 2024-08-30 12:27 北京
请问一面结果大概多久出的呀
点赞 回复 分享
发布于 2024-08-28 15:35 内蒙古

相关推荐

温州头等大孝子:你们的确很幸福,但是有一个小问题:谁问你了?我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了
字节跳动开奖367人在聊
点赞 评论 收藏
分享
评论
9
40
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务