成就我的未来

01-09 00:15 中南大学算法工程师

关注

字节大模型算法校招一面

1、实习介绍
2、讲述论文内容和细节。
3、对于模型训练过程中，如果出现样本标签数据分布极其不均衡，通常会采取什么方法来解决问题。
4、transformer的感受野encoder中是可以看到所有的token的，你认为感受野越大越好还是越小越好。
5、位置编码：sin cos，正余弦，bert可学习位置编码，rope相比于正余弦编码的优势。
6、欠拟合和过拟合定义，通常如何解决？
7、transformer的位置编码的基底是10000，为什么设置10000
8、手撕：岛屿的数量。

全部评论

推荐最新楼层

04-06 21:17

复旦大学 Java

字节暑期实习面试解析

大家好，我是@程序员花海_,今天来解析一套牛友投稿的面试题。1，自我介绍2，项目拷打3，单点登录是什么，怎么实现？4，知道权限管理吗？RBAC？5，工作流怎么使用的？如何不修改代码适应多种需求？6，es深度分页7，支付怎么防止重复支付8，什么是微服务9，设计一个电商系统的微服务10，分布式事务怎么实现的？11， 分布式文件系统用的是什么？有什么问题？12， 订单支付用了哪些第三方？手撕，小于n的最大数整体来看，这套面试题业务与技术并重，既考基础概念，又考场景设计，还附带算法手撕，对知识广度和深度要求都比较高。准备这类面试时，一定要提前梳理好项目细节，把单点登录、权限、分布式事务、支付幂等、微服...

查看12道真题和解析

点赞评论收藏

分享

04-01 12:17

门头沟学院算法工程师

攒人品 TME面经

1-4. 项目提问5. lora是啥讲一下6. 了解transformer架构吗7. 为什么现在的模型都用decoder？8. 了解哪些推理加速的方法？9. 了解小龙虾吗？你感觉他的代码架构对你有什么启发？

查看6道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

04-13 15:30

门头沟学院 Java

虾皮大模型后端开发一面-日常实习

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1、实习拷打2、手撕：荷兰国旗问题lc75；没想起来Scanner库是哪个包里的，面试官让我分析下写的代码。3、项目拷打：图文社交平台项目：（1）网关（Gateway）的鉴权是如何实现的？与用户认证的关系？（2）Token是如何生成和设计的？JWT在其中扮演什么角色？（3）二级缓存（Redis + Caffeine）的数据结构是如何设计的？存储了什么内容？（4）如何保证缓存（Redis与数据库之间、Redis与Caffeine之间）的数据一致性？（5）项目中使用了Cassandra，为什么选择它？与MySQL相比有什么优势？电商秒杀平台（黑马点评Plus）：（1）秒杀功能的整体流程是怎样的？（2）如何防止超卖和保证一人一单？（3）Redis + Lua脚本具体是如何实现的？涉及哪些数据结构和命令？（4）为什么选择Redis+Lua而不是Java本地锁？（5）消息队列（RocketMQ）在其中的作用是什么？如何解耦？4、八股文环节：MySQL：（1）InnoDB事务是如何实现的？（2）MySQL有哪三种日志？各自的作用是什么？RocketMQ：（1）发送一条消息的完整流程是怎样的？（2）RocketMQ的存储设计有什么特点使其性能较高？（3）RocketMQ有哪些高性能设计？（4）RocketMQ的延时队列是如何设计的？

查看17道真题和解析

点赞评论收藏

分享

04-09 16:00

门头沟学院 Java

淘天大模型Agent校招面经

1、为什么决定选用RAG这个技术框架?2、为什么要用向量检索(RAG)?不用其他方式?3、Transformer中Attention的本质是什么?4、SFT的核心流程有哪些，SFT之后常见的Post- Training有哪些?5、如果让你设计一个多轮对话的Agent,你认为纯 Attention结构在处理长时间对话时，会遇到哪些瓶颈?6、什么是RAG，为什么没选向量库?7、现在给你一个RAG系统,你怎么设计一套评估方案来判断它‘好用’?8、你用的切分策略是什么?9、Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?10、在做对齐时，PPO和DPO你更倾向于用哪个? 有什么区别?11、假如一个Agent推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化?

查看11道真题和解析

点赞评论收藏

分享

评论

4

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的求职进度条 #

1253846次浏览 9282人参与

# 第一份工作应该选择高薪还是大平台 #

221281次浏览 1048人参与

# 华泰星战营，提前锁定校招offer #

5947次浏览 294人参与

# 你简历上最心虚的一句话 #

3788次浏览 26人参与

# 考公VS就业，你怎么选？ #

100353次浏览 526人参与

# 哪些公司对双非友好 #

230595次浏览 1239人参与

# 卷__卷不过你们，只能卷__了 #

60370次浏览 759人参与

# 校招第一份工作你干了多久？ #

150466次浏览 631人参与

# 商战，最累的是我们 #

31798次浏览 99人参与

# 国企/银行/研究所公司爆料 #

209622次浏览 920人参与

# 荣耀求职进展汇总 #

1176759次浏览 5674人参与

# 比特大陆工作体验 #

18833次浏览 89人参与

# 找工作的破防时刻 #

289901次浏览 2066人参与

# 小红书求职进展汇总 #

238732次浏览 1397人参与

# 面试等了一周没回复，还有戏吗 #

240152次浏览 1842人参与

# 哪些公司在招寒假实习？ #

93847次浏览 765人参与

# 面试线索爆料 #

127467次浏览 699人参与

# 春节前，你还在投简历吗？ #

43228次浏览 351人参与

# 字节7000实习来了，你投了吗？ #

44994次浏览 351人参与

# 大疆求职进展汇总 #

700088次浏览 4351人参与

# 总结:offer选择，我是怎么选的 #

287711次浏览 1566人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务