字节大模型算法一面凉经 没招了

整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1.项目提问
2.聚类怎么实现?
3.层次聚类和DBSCAN有什么区别?你用了什么停止准则?
4.解释TD3
5.为什么不用PPO而用TD3?
6.TD3为啥输出的是确定性策略,里面的actor不也是概率的吗?
7.大模型里的RL了解过吗?
8.相对和绝对位置编码有哪些?相对位置编码的优势?
9.能外推的相对位置编码有什么?
10.Normalization有哪些?
11.NLP任务里为什么用LN不用BN?
12.BN适用于哪里?为什么?
Python基础:
1.运算符是干嘛的
2.kwargs和*args什么区别
3.Print(*args)输出什么
4.进程,线程,协程
5.Async
6.@是什么?pytorch里具体怎么实现的?
7.装饰器的原理
手撕:最长公共子数组,用O(n)方法实现(可以看出面试官想挂我
全部评论
秋招吗,还是实习的面经
点赞 回复 分享
发布于 03-08 01:56 江苏

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务