快手商业化java日常实习两面面经

一面11.10

1.拷打实习,因为我课题组做cv相关,一直在拷打cv这块,但我很菜,也没有好好准备,答得很不好
2.有了解过大模型吗? 回答平常工作会用到,没深入了解过
3.那介绍下transformer原理吧 (….人傻了.)
大概拷打半小时
4.来做个算法题吧:二叉树叶节点的第二高度
刚开始用层序,问可以做到常数空间复杂度吗,回答回溯+两个变量记录高度。面试官说可以,不用写了
5.线程池原理
6.mysql行锁和表锁,什么时候会用到表锁
7.java代码从编写到运行整个运转过程(jvm)
8.乐观锁和悲观锁
反问:面试表现和这个岗位对应的工作
回答:整体还可以,工程化对细节了解的不够。部门主要做tob相关的系统,也有大模型这些。
二面 11.14
1.自我介绍
2.你简历有用到cv这一块,面的是java后端开发,那你对未来职业有什么明确的规划吗
3.了解过机器学习、深度学习、强化学习这方面吗
4.了解大模型幻觉问题吗,有哪些解决手段呢
5.你说到联网搜索,那你知道联网搜索是怎么实现的吗
6.大模型token大小怎么做限制
7.RAG了解吗
8.介绍下你的实习项目(cv),项目是怎么实现的,会遇到哪些问题,涉及到哪些深度学习的点?
9.对于模型训练来说,训练集构建是一个很关键的问题,你觉得该怎么构建数据集呢
10.样本中的坏样本怎么发现,怎么剔除?
反问 面试评价,说跟经历部门挺契合的
无手撕,无八股,没问java项目,30分钟结束

总结一下 这个部门走的不是传统开发,我投的java开发,面试问的全是大模型,准备的几个java项目完全没问
不过也可以了,未来开发肯定是往agent开发方向走的,愿意去体验一下,也是读研以来第一个实习
全部评论
部门叫啥呀佬
点赞 回复 分享
发布于 11-24 15:25 山东

相关推荐

常规问题: 1. 3分钟简单自我介绍2. 在实习和开源经历中,你遇到的最大困难或最具挑战性的事情是什么?实习拷打(拓展相应的场景八股)慢 sql 治理相关的1. 你在平台稳定性建设中提到通过添加索引、读写分离优化慢SQL,具体是怎么做的?2. 读写分离可以再详细说一下吗3. 能否举一个添加索引的具体例子?比如在哪个字段上加了什么类型的索引?4. 你加的是单列索引,如果查询只需要表中的几个字段,当前的单列索引是否有优化空间?5. 联合索引相比单列索引的优势是什么?为什么更优?(从回表,索引下推优化那个方向说就好)es 慢查治理相关1. 关于ES扩容主分片优化查询,具体是怎么做的?2. 系统的ES集群资源配置你了解吗?(如CPU、节点数等)3. 扩容分片数量是如何确定的?仅依据数据量吗?4. 分片切割后为什么查询会变快(并行查询)5. 将 long 类型字段转为keyword类型,是如何利用跳表结构的?这里其实并不能,只是切换是为了适应精准匹配的场景,keyword 的底层用的是倒排索引+跳表6. 除了分片扩容和类型转换,还有哪些方式可以优化ES慢查询?(force merge 整理碎片)分布式锁(业务中有个并发修改用到了,主要问的一些分布式锁的实现细节)1. 你在业务中使用的分布式锁是标准库还是自研的?2. 让你自己实现一个最简单的分布式锁,你会怎么实现?3. 如果任务加锁后异常退出,没有释放锁,如何避免死锁?4. 如果任务执行时间很长,锁过期被其他任务获取,原任务完成后误删了别人的锁,如何解决(防止锁的误释放,加标识)5. 如果任务A包含多个子任务,且子任务本身也有加锁逻辑,在嵌套调用时会因重复加锁失败,如何解决?(可重入锁的实现)6. 在秒杀场景下,能否直接用分布式锁控制库存扣减?会有什么问题?7. 如何让秒杀请求不立即失败?(锁的自旋)并发编程1. 你使用CompletableFuture并发查询多个维度,底层是如何实现并发的?2. 你是自己定义线程池,还是使用默认线程池?3. 你是基于什么依据设置线程池参数的?4. 如果一个任务同时包含CPU密集型和I/O密集型操作,共用一个线程池会有什么问题?应该如何设计?(线程池隔离,避免cpu密集型任务阻塞I/O密集型任务)Agent和开源相关的内容1. 你的基座模型切换(DeepSeek → 千问)后,响应是流式还是非流式?2. 为什么关注完整响应时间,而不是首字响应时间?(主要是业务上的一个需要)3. 你的性能优化目标是在保证输出内容不变的前提下缩短生成时间吗?4. 你在Agent框架中使用了责任链模式和观察者模式,请分别解释这两种模式5. 既然有四个固定执行步骤(Agent执行前,执行后,模型执行前,执行后),是否可以用模板方法模式替代责任链模式?6. 你使用观察者模式的具体场景是什么?为什么选择它?7. 你还了解哪些常用设计模式?8. 你提到使用HNSW算法进行向量搜索,能简述其基本原理吗?(避免全表的向量查询)9. 为什么不直接用余弦相似度做全量匹配,而要引入HNSW?10. 你是否使用过BM25算法?它的作用是什么?11. 向量搜索有哪些弊端?12. 向量检索和BM25全文检索的得分量纲不同,如何进行混合排序?(引入一个精排模型重新打分)反问:1. 业务(智能客服相关)2. 不足,基础还需要加强无手撕,总体一个小时总结:面试体验很好,主要就是根据简历延伸一些八股和简单场景,有些还需要加强的地方,挖出来了自己基础上的一些问题
点赞 评论 收藏
分享
评论
2
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务