美团27暑期大模型算法凉经分享

攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2. 讲论文
3. 4k* 4k输入qwen3.5和qwen1,分别占用多少token(mlp和q-former)
4. 为什么qwen从q-former转到原生分辨率
5. 对齐做过吗
6. 从对齐这个角度出发分析qwen3.5会做原生的多模态,原生和非原生的区别是?
以为说的是分辨率答了个动态分辨)
7. 算一下模型训练和推理时候显存占用,算一下kv cache的显存占用
8. 为什么训练的时候不需要缓存kv cache
全部评论
最后通过了吗
点赞 回复 分享
发布于 昨天 23:29 北京
感觉问的不多呀
点赞 回复 分享
发布于 昨天 23:29 北京

相关推荐

04-15 12:30
门头沟学院 Java
攒人品中,祝大家都能拿到满意的Offer!1.实习拷打2.手撕代码:三数之和,问了点边界情况3.从基础开始吧。你知道这个 string 啊, string buffer, string builder 这三个类有什么区别吗?4.队列的一些方法:插入用啥,查看队首用啥,出队用啥?还有栈跟队列的区别5.双亲委派模型了解吗,设计的目的是啥?它怎么防止重复加载?,有没有打破双亲委派模型的例子?为什么要打破呢?6.然后你用过反射吗?反射是什么?应用场景?7.所以你刚才说那个注解,那个注解的原理是什么?讲一下注解的原理8.然后 IOC 知道吗?讲一下 IOC。9.怎么声明一个对象?(@Autowired 和构造器)10.幂等性了解吗?怎么实现幂等性?11.线程跟进程的区别?12.线程池的参数?13.那核心线程数、最大线程数是表示什么含义呢?14.那他一般核心线程数怎么设置的?为什么要这么设置?15.一般保证多线程安全的方法有什么?16.synchronized和 volatile 的区别?synchronized底层原理?锁升级的机制?为什么要锁升级?17.ConcurrentHashMap怎么保证线程安全?18.ThreadLocal在项目中有用过吗?内存泄漏?19.常用的 SQL 优化的技巧?20.MySQL常用的两种引擎,区别?(只具体答了InnoDB,MyISAM只回答了个名字)21.redolog undolog22.什么叫不可重复读?23.那个我们怎么看一个 SQL 语句就是它的查询性能呢?24.OSI七层模型
查看22道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务