03-30 21:50 门头沟学院算法工程师

关注

鹅厂搜推算法实习面经攒人品中

继续来分享下之前的面经~欢迎友好讨论，信息共享
1.正负样本极度不均衡（比如 1:1000）会对模型训练带来什么实质性问题？
2.线上线下指标不一致，是因为正负样本比例太低导致的吗？
3.假设正负样本比例是万分之一，如果模型把所有预测分都打得很低，此时的 AUC 大概是多少？AUC 的计算和正负样本比例到底有没有直接关系？

4.GAUC 主要是为了解决什么业务痛点提出来的？它本身有什么局限性？
5.计算 GAUC 进行加权平均时，为什么权重通常用“点击次数”而不是“曝光次数”？
6.如果在一个计算窗口内，某个用户没有任何点击行为（没有正样本），算 GAUC 时怎么处理这个用户？

7.长短点击序列的时间跨度分别是多久？长期序列的原始数据覆盖了多长的周期？长序列特征在工程上是在哪里、通过什么方式截断过滤的

8.介绍一下精排模型的结构（主要是讲清楚 DNN 的结构）。Attention 机制的具体计算方法？
9.算相似度除了内积还有其他操作吗？
10.对业内其他的 Attention 结构有了解吗？Multi-head Self-Attention 的 Attention Score 具体是一步步怎么算出来的？

11.手撕代码
求数组中的最长连续递增子序列的长度。

全部评论

推荐最新楼层

03-17 22:01

已编辑

广西大学算法工程师

小鹏汽车 AI Agent 开发一面

1、自我介绍2、项目拷打3、介绍 DeepSeek 与 Manus，以及他们之间区别4、介绍 LLM Decoder-Only 架构Decoder-Only 架构本质上就是只使用 Transformer 里的 Decoder 结构，通过自回归的方式一个 token 一个 token 地往后生成内容。它的训练目标通常是 next token prediction，也就是根据前面的上下文预测下一个 token。它的关键点在于 Masked Self-Attention。所谓 masked，就是当前位置只能看到前面的 token，看不到后面的 token，这样模型才能按从左到右的方式学习生成。整体结...

查看13道真题和解析

点赞评论收藏

分享

03-29 00:25

门头沟学院算法工程师

小红书大模型算法一面攒人品-暑期实习

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.主页精排模型的序列如何建模的3.主页精排模型的样本是如何组织的，listwise和user level有什么区别4.你迭代模型的最终版本的结构5.tokenmixer上线了吗，没有收益的原因是为什么6.介绍tokenmixer的结构7.什么情况下tokenmixer会比mmcn、dcn有效;8.为什么数据量足够的情况下，同参数量的情况下，tokenmixer的效果要更好;为什么tokenmixer的效率更好9.八股提问1.介绍几个序列建模的方法2.din和transformer的各自的优势是什么，他们建模的本质差别是什么，他们的qkv有什么区别3.transformer对序列建模具体是怎么做的4.din的qkv和transformer的qkv都是从什么输入得到的5.长序列直接入图的方法有什么，直接用transformer建模有什么问题6.有什么降低时间复杂度的方法7.线性注意力具体是什么方法，还有什么把注意力复杂度从平方减到线性的方法手撕写一个tokenmixer得到最后的output怎么用，mean_pooling和sum_pooling有什么区别pffn具体如何实现，mixup具体如何实现

查看18道真题和解析

点赞评论收藏

分享

03-31 13:22

中国科学技术大学 C++

【笔试刷题】携程-2026.03.29-算法岗-改编真题

✅ 春招备战指南 ✅ 💡 学习建议：  先尝试独立解题 对照解析查漏补缺   🧸 题面描述背景等均已深度改编，做法和题目本质基本保持一致。 🍹 感谢各位朋友们的订阅，你们的支持是我们创作的最大动力 🌸 目前本专栏已经上线200+套真题改编解析，后续会持续更新的  春秋招笔试机考招合集 -> 互联网必备刷题宝典🔗 携程-2026.03.29-算法岗 这套算法岗和开发岗共享了 3 道通用题，中间夹了一道更偏计算实现的注意力题。前两题还是热身节奏，第 3 题需要把整套流程按矩阵规则完整落地，第 4 题继续是数论跳跃。 题目一：字母 a 的位置 固定长度、固定字符集，直接顺扫即可，是明...

互联网刷题笔试宝典

点赞评论收藏

分享

03-31 04:35

门头沟学院算法工程师

搜广推算法实习一面-快手

攒人品中！ 1.介绍实习项目中主要负责的工作2.论文拷打3.项目拷打4.讲解原始 RoPE 的原理5.讲解 GRPO 的实现方式6.讲解 PPO 和 DPO 的相关原理7.讲解 Transformer 的 Encoder 和 Decoder 相关内容，包括 Encoder 的模块组成8.定义 rag 中召回率的计算和评判标准9.讲解 MHA 中 Q 的定义， Attention 计算过程10.说明 MHA 采用多头设计的原因11.对比 Encoder 和 Decoder 的主要区别12.讲解 MQA 和 GQA 的相关原理13.手撕：最长括号序列

查看11道真题和解析

点赞评论收藏

分享

03-31 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

35446次浏览 441人参与

# 想从事Agent应该学习哪些技术？ #

8672次浏览 295人参与

# 有哪些公司在面试时考察AICoding？ #

19647次浏览 350人参与

# 你的第一家实习公司是什么档次？ #

70325次浏览 335人参与

# HR面都在聊什么？ #

13920次浏览 164人参与

# 大学生该如何认清当下的就业环境？ #

162547次浏览 889人参与

# 26届春招投递记录 #

3656次浏览 42人参与

# 从投递到OC，你用了多久 #

24077次浏览 241人参与

# 什么人最适合大厂？ #

12902次浏览 134人参与

# 哪些公司面试还在问八股？ #

14298次浏览 125人参与

# 父母问你工作找得怎么样，怎么回 #

23305次浏览 285人参与

# 我的求职进度条 #

1117806次浏览 8063人参与

# 如何快速融入团队？ #

50128次浏览 306人参与

# 校招生月薪1W算什么水平 #

143454次浏览 493人参与

# 你觉得什么岗位会被AI替代 #

57289次浏览 371人参与

# 多益网络工作体验 #

68595次浏览 310人参与

# 薪资爆料 #

412715次浏览 2209人参与

# 美团开奖 #

407837次浏览 1805人参与

# 运营来爆料 #

98846次浏览 508人参与

# 你觉得机械有必要实习吗 #

83702次浏览 529人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务