字节大模型一面

📍面试公司:抖音
💻面试岗位:大模型算法
❓面试问题:
1. 拷打实习,问了很多很详细的数据和做强化学习的motivation
2. 八股拷打(好久没看基础机器学习了都忘了)
介绍一下优化器的发展
现在大模型的优化器是什么
ln和bn的区别
encoder-only和decoder-only区别以及应用场景
qkv具体是什么
为什么是多头注意力
上下文长度是什么,有什么作用
lora和全参区别
欠拟合和过拟合具体要怎么办
3. 手撕一个复杂度o(1)的插入删除和随机等概率返回(最近怎么遇不到hot100了)
🙌面试感想:
面试官人很好业务也很好玩,可惜了我手撕写了好久好久还磕磕巴巴
#面试问题记录##秋招笔面试记录##字节##算法##算法岗面试#
全部评论
还有一点很奇怪的,问了两个开放性问题,1.人生中目前遭遇的最大的挫折,2.为面试刻意做了哪些准备(暴露了我lc菜狗的事实)
1 回复 分享
发布于 08-26 09:43 甘肃
学到,感谢楼主分享
点赞 回复 分享
发布于 昨天 11:05 北京

相关推荐

08-26 22:06
东北大学 Java
20min 实习怎么用redis+token实现登录的?Redis缓存token这种存储方式的弊端,存在什么安全隐患?这种方式的弊端后续怎么去解决?Redis缓存token业务层面会有哪些风险,业务层面的风险怎么解决?Redis高并发、低耗时的底层是因为什么机制?Redis主从同步的逻辑是什么,主从同步有哪几种方式,持久化的方式,最常用哪些方式?Redis支持事务吗,怎么支持?慢查询怎么定位和规避,在日常开发情况下,怎么做规避,有没有关于SQL的最佳实践、最佳原理。20min场景题在抖音里面有一个关注功能,设计关注跟取消关注功能,怎么去设计,包括底层的设计、存储设计。对于用户的规模不一样的情况(小博主、大博主),底层在设计的时候会有什么差异?一个网红博主,发了一条动态,怎么去发送给粉丝?上游怎么去消费发的这些消息?5min开放题未来职业规划+个人优势10+min手撕输出一个数组的全排列 a b c -> abc acb bac bca cab cba第二天挂基本全是场景题和设计方法,看似很开放,但还是要答出来面试官想听到的点,我感觉我说的挺对的,实际上可能最开始回答的方向就不对,讲了很多系统设计上的思考,忽视了业务方向的思考。难难难,实在是太难了,有一种有力没处使的感觉。已经换部门重新从一面开始了
求offer的花生米...:面字节太累了,剪映飞书全都是最后一轮挂了,心态都炸了
查看12道真题和解析
点赞 评论 收藏
分享
评论
3
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务