昨天 18:45 门头沟学院算法工程师

关注

快手-暑期实习-多模态算法面经夯爆了

给我面没招了，发点面经攒攒人品～
项目拷打
CLIP部分
1.CLIP的结构+一个batch里面混入了相同的图片，也就是说一个正样本被当作一个负样本，但它实际是一个正样本，怎么去解决和避免这些问题?在训练或者说Loss层面
2.CLIP可以做分类吗?通过对齐的方式做分类你觉得是可行的吗?
3.图像输入给大模型，解码输出文本，这样的对齐方式和CLIP有什么区别?这两种哪种是未来趋势?
偏八股部分
1.COT有了解过吗?结构化的输入/few-shot 为什么会有帮助?(模型层面)
2.有了解过哪些大模型?BLIP2的三个loss介绍
3.现在大部分的结构不采用Q-former，而用MLP，是为什么?那为什么之前不用MLP，而用Q-former?
4.一个多模态模型，它的视觉和文本编码器的参数量大小有什么配比的逻辑?
5.一个5乘5的卷积，它可以由几个3乘3的卷积串联来替换，从而减少计算量但保持感受野不变?
6.分类任务需要很多标注样本，但是现在想在少量样本的情况下，实现新增任务的效果，如何实现?不希望通过大量数据做微调
手撕：经典力扣全排列

全部评论

推荐最新楼层

昨天 22:37

广西大学算法工程师

小红书 AI应用开发一面

1. 如果知识库原始数据不是 markdown，而是 PDF、PPT、图片或者网页，你会怎么处理进 RAG 系统？PDF 和 PPT 会提取标题、段落、表格和页码，图片先做 OCR，网页先抽正文和元信息，然后统一清洗噪声、去掉页眉页脚、按语义做切片，补上来源、时间、文档层级这些元数据，最后再做 embedding 和索引。这样后面的召回、溯源和权限控制都更稳定。 public List<Chunk> buildChunks(Document doc) { List<Block> blocks = parser.parse(doc); List<Block> ...

AI-Agent面试实战...

点赞评论收藏

分享

昨天 21:18

门头沟学院 Java

快手暑期实习一面

1、自我介绍2、拷打实习3、数据库四大特性，mvcc原理（版本链在哪（undolog）），四大日志、两阶段提交4、spring事务原理、是否依赖数据库事务5、Redis日志6、mysql主从同步7、Redis的日志8、Redis事务9、aop原理10、rabbitmq与kafka选型11、kafka的reblance（重复消费、乱序）12、数据库清理磁盘之后为什么磁盘还在被占用着13、事务消息、死信队列14、mysql的索引底层结构，b+树为什么比b树好15、Redis先写日志还是先执行命令（命令，防止命令有问题）16、leetcode128最长连续序列/三数之和面试官真的很好，不会的话还会引导你，可惜我太菜了，算法第一眼看错题了看成最长递增子序列了，没写出来，后来换成了三数之和，还忘记剪枝了，不知道还有没有机会，鼠鼠决定从明天开始苦修算法！！！发面经攒人品

点赞评论收藏

分享

昨天 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

03-29 00:25

门头沟学院算法工程师

小红书大模型算法一面攒人品-暑期实习

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.主页精排模型的序列如何建模的3.主页精排模型的样本是如何组织的，listwise和user level有什么区别4.你迭代模型的最终版本的结构5.tokenmixer上线了吗，没有收益的原因是为什么6.介绍tokenmixer的结构7.什么情况下tokenmixer会比mmcn、dcn有效;8.为什么数据量足够的情况下，同参数量的情况下，tokenmixer的效果要更好;为什么tokenmixer的效率更好9.八股提问1.介绍几个序列建模的方法2.din和transformer的各自的优势是什么，他们建模的本质差别是什么，他们的qkv有什么区别3.transformer对序列建模具体是怎么做的4.din的qkv和transformer的qkv都是从什么输入得到的5.长序列直接入图的方法有什么，直接用transformer建模有什么问题6.有什么降低时间复杂度的方法7.线性注意力具体是什么方法，还有什么把注意力复杂度从平方减到线性的方法手撕写一个tokenmixer得到最后的output怎么用，mean_pooling和sum_pooling有什么区别pffn具体如何实现，mixup具体如何实现

查看18道真题和解析

点赞评论收藏

分享

03-17 22:01

已编辑

广西大学算法工程师

小鹏汽车 AI Agent 开发一面

1、自我介绍2、项目拷打3、介绍 DeepSeek 与 Manus，以及他们之间区别4、介绍 LLM Decoder-Only 架构Decoder-Only 架构本质上就是只使用 Transformer 里的 Decoder 结构，通过自回归的方式一个 token 一个 token 地往后生成内容。它的训练目标通常是 next token prediction，也就是根据前面的上下文预测下一个 token。它的关键点在于 Masked Self-Attention。所谓 masked，就是当前位置只能看到前面的 token，看不到后面的 token，这样模型才能按从左到右的方式学习生成。整体结...

查看13道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

4373次浏览 48人参与

# 金融银行求职进展汇总 #

329610次浏览 1810人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

22115次浏览 436人参与

# 大厂实习和小厂实习最大的区别是什么？ #

12098次浏览 83人参与

# 你都用vibe coding做过什么？ #

1950次浏览 60人参与

# 如果人生可以debug你会改哪一行? #

2360次浏览 54人参与

# 厦门银行科技岗值不值得投 #

11589次浏览 293人参与

# AI Coding实战技巧 #

1531次浏览 41人参与

# Vibe Coding 会干掉初级岗位吗？ #

4133次浏览 80人参与

# 你见过哪些招聘隐形歧视？ #

2557次浏览 33人参与

# 做完笔试后你收到面试了吗？ #

3751次浏览 50人参与

# 面试被问到不会的问题，你怎么应对？ #

4014次浏览 34人参与

# 牛友の3月总结 #

8082次浏览 79人参与

# 你现在一天AI几次？ #

1243次浏览 41人参与

# 七猫笔试 #

5715次浏览 37人参与

# 选完offer后，你后悔学本专业吗 #

66608次浏览 262人参与

# 实习学到最有价值的工作习惯 #

66837次浏览 541人参与

# 哪些公司真双非友好？ #

71391次浏览 305人参与

# 最难的技术面是哪家公司？ #

71722次浏览 1063人参与

# 你认为小厂实习有用吗？ #

133410次浏览 720人参与

# 快手工作体验 #

321686次浏览 2932人参与

# 找AI工作可以去哪些公司？ #

24735次浏览 1062人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务