拼多多大模型

【一面】
1)介绍一个最能代表自己的项目
2)项目里负责的边界是什么?哪些内容是亲手实现/验证的?
3)电商领域预训练数据:低质过滤与去重会怎么做?用哪些简单指标快速判断数据质量?
4) Pretrain 和 SFT 分别解决什么问题?
5) Transformer 的基本结构怎么理解?
6)多模态模型的大致结构是什么(图像编码器+连接层+ LLM )?最容易踩坑的点通常在哪里?
7) SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
8)对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
【二面】
1)做过的最有影响力的一件事是什么?具体推动了什么变化?
2)训练不稳定怎么排查( loss NaN 、 OOM 、吞吐下降)
3) Long Context 常见思路有哪些?在业务里如何做"能看长文本但不太贵"的折中(摘要/分段/滑窗等)?
4)如何做一套简单可执行的离线评测集?如何覆盖不同语言与类目?
5)多模态场景怎么评估:如何检查"图文一致性/不编造信息"?优先加哪些自动化检查?
6) Prompt /模板如何管理:如何版本化、如何回滚、如何避免一次改动导致整体波动?
7) 手撕:实现一个最简单的 top - k 采样(给定 logits /概率,取 top - k 后重新归一化采样),并说明边界情况怎么处理。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
感觉挺友好的?看那么多面经唯一一个几乎全会的
点赞 回复 分享
发布于 03-15 17:15 江苏

相关推荐

03-29 18:21
已编辑
北京科技大学 人工智能
岗位:大模型算法四道编程  做了三道  第四道两眼一黑第一题:有一辆货车,途径N个站点,车上初始货物量为initiaWeight,最大限额是maxWeight,每个站点要么装货(整数),如果装货之后大于最大限额就是危险了,比如说你现在车上6个,这一站要装4个,最大是9,6+4>9就不行,但是等于9是可以的,要么卸货(负数),如果目前装在的货物小于卸货要求,直接全部卸下,就是比如说你现在车上3个货物,这一站要写下来4个(-4),3-4=-1嘛不是,但是不可能没有硬卸,变为0就行,问你在安全装载状态下最长能连续经过几个站点非常简单的题,一遍96%,就没看了,直接下一道了第二道:有n门课,每门课有一个先修课,比如说2的先修课是1,那修完1才能修2,给你n门课的先修课序列,问你修完n门课要几学期,举个栗子:5门课  -1 1 2 1 -1(-1表示没有先修课)下标: A B C D E (为了不弄混,我先用字母表示)这个就是需要三个学期,第一学期:A和E,第二学期:B和D,第三学期:C这道题,怎么说呢,看到先修课我以为是输出拓扑排序,昨天才笔了一样的,结果写到一半发现不对,然后又重新写,然后这个序列是从1开始的,这个又浪费我好几轮,然后还有一开始理解错了,我以为序列是先修课有几个,比如说这个2,我本来以为是C的先修课有两个,我心想,那不就是3吗?选最大的+1得了呗,过了80%,我都傻了,后来发现我写的逻辑完全不是人家说的,最后是用了一个数组,先初始化为0 ,然后遍历,比如说A不需要先修课,那就是0,然后B要先修A,就是0(A的先修)+1,C要先修B,那就是1(B的先修)+1,这样然后遍历数组找到麻小,输出max+1应该是很简单的题,我先入为主浪费好多时间,最后是100%第三题有N个奖品,价值为vi,有俩包,一个物品只能放进一个包里,然后一个包里的奖品就,任意两个之间的价值差不能超过T,问你最多俩包能装多少奖品我用的最笨的方法——暴力  但是可能我的逻辑写的不对,只有15%然后换了一种N=6  T=3vi: 5 4 2 1 8 10先sort排序——1 2 4 5 8 10算从1开始,一个包能装多少,那就是 1 2 4,下标就是0 1 2,用了一个end数组,end[0]=2——记录从下表为0的奖品开始,能装的最后一个奖品的下标end[0]=2 —— 一个包能装3个  包1end[1]=3 —— 一个包能装3个  包2end[2]=3 —— 2个  包3end[3]=4 —— 2个  包4end[4]=5 —— 2个   包5end[5]=5 —— 1个  包6如果我选了包1,那么保证一个奖品不能出现在同一个包里,包2和3就不能选,然后选剩下包里最多的,这就是从奖品0开始装,最多能装多少,然后取最大有点饶了,我比较菜,正能想到这个方法了,只有60%第四题一笔画,且点不重复的情况下,在一幅图里最多从起到回到起点,最多一笔画能包含几个点手画个图,凑活看吧题目是说要city walk,实线是主干道,虚线是小路(P1),然后让你规划路线,答案是P2
熙里咕噜:第三题我先对v数组排序,然后用一个两层的循环去维护一个数组arr,arr[i]代表以第i个物品为起点,一个背包最多塞几个物品,因为排过序所以很好找,只要遍历到第j个元素满足vj-vi>t就arr[i]=j-i,然后break,以此类推。然后下面再用两层循环更新答案,第一层循环表示第一个框的起点,第二层循环表示第二个框的起点,第一层循环是i=0开头,第二层循环是j=i+arr[i]开头,ans和arr[i]+arr[j]的和比大小,选择大的更新答案。最后考虑一个背包就能装下所有物品的特殊案例就能AC
查看4道真题和解析
点赞 评论 收藏
分享
03-31 02:31
已编辑
新疆大学 Java
21号 一面 把简历项目都问了一遍 然后问了很多八股 但是回答得不太好 大概答出65%一面的算法题是HOT100滑动窗口改编 中等难度吧 很快撕出来了当时面完感觉要挂了 因为八股答得不好 结果过了 然后约二面  我定在27号 期间恶补了很多知识27号 二面 项目挑了重点问 然后问了一些八股 感觉和面试官聊的挺开心,八股答出来90%吧 项目也聊的不错    然后八股深挖了MySQL   问爽了 因为最熟的八股就是MySQL   后续就是几个场景题回答的不是特别好然后出了一个 “基本计算器 III” (要考虑加减乘除还有括号)有思路 但是思路不清晰主要是太久了忘了 然后没完全写出来,大概写出来60%的样子吧 乘法和除法的逻辑没处理好  最后面试官让我谈一下思路 我说了一下 面试就结束了二面结束我感觉还是比较不错的,感觉要过,虽然算法题写的不好,但是八股和项目聊的不错。结果挂了个人感觉是算法题没撕出来挂了可惜的是 “基本计算器 III” 这个题大一学算法的时候研究过 我记得我还在Acwing上面听yxc讲过 感觉还打过卡我清晰的记得我听过这道题的解法,但是我明确的知道我忘记咋做了没事  胜败乃常事 来日再战必胜。
查看8道真题和解析
点赞 评论 收藏
分享
评论
点赞
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务