字节二面

1 dpo ppo区别(ppo不会,讲dpo)
2 dpo训练遇见什么问题了,如何解决,扯了半天但是感觉也没说对(其实不会,一直扯对比学习)
3 最新的sota的embedding模型什么结构,什么技术(没关注过)
4 decoder only和encoder only的embedding模型分别有什么优点,谁更好(不会,只能说出个因果注意力和双向注意力,然后说可能encoder更好一点,然后被更深入问,然后烂了)
5 强化学习advantage讲一下(这啥啊,完全没听说过)
6 rag怎么优化的
7 传统rlhf怎么做的
8 gpt2和llama3在transformer层的区别(我就只说了norm和激活函数)
9 拷打实习

手撕 mha
全部评论
大佬太强了
点赞 回复 分享
发布于 2024-09-27 20:13 湖北
约三面了
点赞 回复 分享
发布于 2024-08-13 16:47 上海

相关推荐

实习 1、展开讲一讲实习里的项目经历。你觉得哪个项目印象最深,就讲哪个> 拷打:包括消息队列异步消费、数据丢失和恢复、吞吐与线程池设计、 补偿与幂等详细可以看:https://yb0os1.github.io/2026/03/12/%E6%9A%91%E6%9C%9F%E5%AE%9E%E4%B9%A0%E8%AE%B0%E5%BD%95八股1、线程间共享与可见性:1. 多线程之间如果要共享数据,一般有什么手段?2. 如果线程 A 修改了一个共享变量,线程 B 怎么看到最新值?3. `volatile` 有什么限制?是不是只要用了它就一定能保证线程可见性?4. 除了 `volatile`,还有其他方式能保证线程之间的可见性吗?5. 为什么加锁也能保证可见性?2、线程私有数据1. 线程里有没有自己独有的内存数据?2. 除了栈这些线程私有的数据,还有别的吗?(这里面试官想要我回答ThreadLocal)3、ThreadLocal1. 你听过 `ThreadLocal` 吗?2. `ThreadLocal` 为什么也算线程独享?3. `ThreadLocal` 是怎么做到线程隔离的?4. `ThreadLocal` 平时一般怎么用?5. 使用 `ThreadLocal` 的时候,有什么需要注意的地方?4、源码阅读情况1. 你平时看过哪些框架源码吗?或者你看过哪些写得比较好的开源代码? (说没有 但是后面问了问hashmap)5、HashMap1. 你看过 `HashMap` 的实现代码吗?2. 你知道为什么 `HashMap` 不是线程安全的吗?3. `HashMap` 的线程安全问题一般会在什么环节触发?算法1、记不太清了,一个dfs的题目,没写出来2、多线程顺序打印1-100,线程数量和每个线程打印的个数 作为参数,还是没写出来,编码掌握的不怎么好感觉g了
查看17道真题和解析
点赞 评论 收藏
分享
评论
3
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务