8.25虾皮一面(我真的很讨厌dp)

8.28更新,已挂😇😇😇

算法方向

自我介绍

面试官:做过微调吗?讲一下SFT基本原理。
我:做过简单的demo,然后稍微说了一下SFT,然后拿 LoRA 举了一下例子。

面试官:SFT说完了,讲一下RL经典算法吧。
唱了一下 PPO,DPO(DPO有点忘了讲得磕碜巴拉的)

面试官:大模型幻觉怎么处理?
我(忘了复习了):答 prompt engineer,RAG,rethink,self-consistent。
感觉他挺想问我 rethink 怎么优化的,我不知道,只能说多轮询问/换模型交叉验证。

面试官:检索算法有哪些?
应该是BM25+向量检索那一套的,我脑子抽了说 IVFFat 和 HNSW 。
唱了一半面试官赶紧打断我,问我BM25怎么算的,公式说一下。
我忘了,就说用词频和逆文档频率(还有个“字段长度归一化”想不起来了)(顺带说一句,问公式诗人???)。

面试官:Transformer 结构讲一下。
原始论文的架构唱了一会儿,他让我讲一下多头,又唱了一下多头。

然后问我为什么 attention score 要除以根号d,我说稳定输出。
他让我再从别的角度讲一下,一遍引导一边问我,说可以从分布角度讲。

第一遍他说的是“温度”,我脑子蒙了,这怎么扯上温度了。唱了一会儿温度的作用。
他赶紧打断我说分布,softmax,又引导了两句,我懵,还是不知道。

他说:为了将方差恢复为1,或者说恢复原始方差。
我(疯狂道歉+尬笑)

面试官:大数据有了解过吗,spark,hadoop 这些。
我(不是你真问啊):不知道。

面试官:sql了解过吗。
我:上学的时候学过一点。
问了我一个场景题,想考我 rank 的用法。
我完全忘完,直接道歉三连。

手撕
1.两数之和。
脑子抽了两次,一次是key写错了瞪眼5min。第二次是换测试用例忘了换target值,瞪眼2min。
最后忙了快10min才写出来。

2.很难描述,给定target序列,序列库。
求最短的序列库

想暴力贪心/回溯,不太行。
面试官说换个思路,我说那就dp吧。他说那你dp吧,想了一下时间快到50min了,让我讲一下思路,纠结了一会儿一维还是二维(太紧张了说是,幻视编辑距离)。
他反问用的到二维吗?我说一维dp就行,但还是得两层循环,稍微说了一下思路。

反问业务都有哪些地方用到大模型,他稍微说了一下。
他说你要是到二面了可以问一下二面的业务,他这边是做智能客服的?
我内心:6。
然后时间也到58min了,我说没问题了,结束。
#秋招笔试记录#
全部评论
同学,瞅瞅我司,医疗独角兽,校招刚开,名额有限,先到先得,我的主页最新动态,绿灯直达,免笔试~
1 回复 分享
发布于 08-27 10:40 广东
老实了,搁这屏幕感觉到了压力
点赞 回复 分享
发布于 昨天 18:03 江西
是深圳这边嘛
点赞 回复 分享
发布于 08-26 18:40 四川
老哥什么bg啊,我一面面玩一天就挂了
点赞 回复 分享
发布于 08-26 16:26 北京

相关推荐

点赞 评论 收藏
分享
评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务