啊啊啊啊啊啊哪有不疯的

03-21 17:53 大连理工大学 Python 发布于辽宁

关注

字节一面

1h
1. 为什么要用dpo，什么任务要用dpo，不用可以吗，用了好处在哪，能优化哪里
2. dpo ppo异同，dpo详细原理，loss
3. 任务为什么不能只用sft
4. 现在的推理模型是怎么训出来的，重点你感觉是哪里，哪里是让这些模型获得推理能力的点
5. r1原理
6. prm 和orm讲一讲，什么情况prm 什么情况orm，哪种更好，重点讲prm的优缺点，为什么现在的推理模型没有用prm

手撕。一个字符串列表，一个长字符串，判断长字符串是否能用这个字符串列表里的词组成。
没做出来，寄寄寄

全部评论

推荐最新楼层

啊啊啊啊啊啊哪有不疯的

楼主

大连理工大学 Python

第六点讲不明白，感觉面试官不是很认可我的回答

，手撕也没做出来，很寄的感觉

点赞回复分享

发布于 03-21 17:56 辽宁

05-27 22:02

哔哩哔哩_游戏算法工程师(准入职员工)

哔哩哔哩内推bilibili内推

不知不觉已经在哔哩实习马上一年了，实话实说哔哩实习的体验感真的蛮好的，今年也成功在哔哩顺利转正，拿到正式的offer了。 首先是实习强度💢 ，这块哔哩确实挺好的，实习的时候组内的大佬都不内卷，每天各自完成自己的工作就能下班回家啦，每天晚上8点半可以拿免费的加班餐，9点半能免费打车回家（我住的近，根本用不到） 🫶️ 团队氛围这块真的没话说，团队内的大佬都很乐意帮助我快速成长，犯错的时候，及时找mentor沟通，mentor真的无所不能，而且还会给自己许多思考的空间 公司还有免费的健身房可以锻炼，我今天从五月份到9月份和同事一起去健身房锻炼已经减掉15斤了，而且最近一段时间又新换了一批设备 哔...

哔哩哔哩公司福利 649人发布

点赞评论收藏

分享

05-28 20:13

中山大学算法工程师

强度拉满:网易大模型算法岗

1️⃣一面时间：9.12  时长：1hcode：统计岛屿数量、最大岛屿面积，DFS方法解了然后介绍实习项目，面试官非常耐心地听，没有打断八股1.bert和gpt的区别？（从模型架构、训练方式、使用场景方面回答的）2.训练/微调一个LLM的流程？3.实习时用的 megatron 框架吗，对分布式训练框架了解多少？（回答了deepspeed和megatron区别，以及几种并行方式，以及deepspeed的三种zero）4.了解强化学习吗，跟SFT有什么区别？5.反问：业务，对岗位的期望💣评价：有点紧张，算法题有一个小失误没注意到2️⃣二面时间：9.14  时长：1h八股1.写一下 attention 公式（代码实现了下）2.训练时为什么要mask，推理时也需要吗？两处有什么区别？推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别？4.计算attention时为什么要除以d_k，这个d_k的含义是？5.attention计算时还有哪些scale处理？6.attention中softmax函数作用、公式、为什么有减去最大值的处理？换个函数还能这样处理吗？7.解释数值上溢、下溢问题8.讲一下prompt书写的经验，如何判断prompt是否达标，如何改进prompt9.讲一下SFT，会对哪部分计算loss？为什么？10.讲一下deepspeed11.训练用一个7b模型要占用多少显存？不同zero阶段能够节省多少显存？12.训练模型时用了几张卡，有遇到什么异常中断问题吗？反问： 在乎候选人什么能力？对面试表现有哪些改进意见？💣评价： 基础不够扎实，网上有的知识都能回答上来，在同龄人里算比较优秀，欠缺一些多机多卡实践经验。  

查看17道真题和解析

点赞评论收藏

分享

06-06 09:35

北京蜜堂有信科技有限公司_运营部_运营经理

2025年全球开源大模型API：阿里通义千问、腾讯混元大模型、xAI Grok3

中国开源大模型品牌 1. 阿里巴巴（通义千问）  代表模型：Qwen3（千问3）系列、Qwen-Agent框架 __特点：__登顶全球开源模型榜单，涵盖语言、多模态、数学、代码等全领域，支持119种语言。阿里巴巴的通义千问系列在开源大模型领域表现卓越。其代表模型Qwen3（千问3）系列和Qwen - Agent框架备受瞩目。Qwen3系列登顶全球开源模型榜单，这一成就彰显了其在技术上的领先地位。该系列模型涵盖语言、多模态、数学、代码等全领域，展现出强大的通用性和综合性。在语言处理方面，它支持119种语言，能够满足不同国家和地区用户的需求，无论是文本生成、翻译还是问答系统，都能提供高质量的服务。...

点赞评论收藏

分享

05-29 18:09

焦作市第一中学运营

求郑州东站附近的内推工作

点赞评论收藏

分享

05-14 12:27

河海大学产品经理

让ai扮演诸葛亮安慰我

我最喜欢的历史人物就是诸葛亮，跟他说现在的世界拥有会费会潜水的木牛流马，最后跟他说我学习压力很大，他真的像我想象中的诸葛先生鼓励我😭

被AI治愈的瞬间

点赞评论收藏

分享

评论

1

3

全站热榜

更多

华为开奖进展

热聊中

创作者周榜

更多

正在热议

更多

# 我的职场心眼子段位 #

7373次浏览 262人参与

# 通信硬件人社招/春招/实习投递现状 #

25582次浏览 927人参与

# 实习最想跑路的瞬间 #

7433次浏览 69人参与

# 运营商笔面经互助 #

147694次浏览 1637人参与

# 你找实习最大的坎坷是什么 #

7387次浏览 81人参与

# 毕业租房也有小确幸 #

116476次浏览 4382人参与

# 你的房租占工资的比例是多少？ #

35282次浏览 536人参与

# 多益网络工作体验 #

46806次浏览 261人参与

# 硬件人秋招的第一个offer #

74711次浏览 1133人参与

# 25届网易互娱暑实进度 #

74644次浏览 688人参与

# 我的求职精神状态 #

71721次浏览 882人参与

# 职场吐槽大会 #

208346次浏览 1657人参与

# 工作中的卑微时刻 #

13956次浏览 105人参与

# lastday知无不言 #

54024次浏览 447人参与

# 你的领导最像哪种动物，为什么? #

12614次浏览 101人参与

# 你见过最离谱的招聘要求是什么？ #

192670次浏览 1421人参与

# 牛友故事会 #

731854次浏览 14580人参与

# 神州信息工作体验 #

10905次浏览 52人参与

# 职场破防瞬间 #

237167次浏览 2170人参与

# 打工人的辛酸 #

41150次浏览 425人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务