腾讯wxg暑期实习大模型算法一面分享

攒人品中
1. 手撕AdamW
2. 手撕无重复字母的字串(hot100)
3.实习拷打
4.面对海量数据的时候怎么对数据进行处理,比如说去除掉敏感词等等,面对海量数据会出现哪些问题,该如何去处理
5.介绍发表的顶会论文
6. 介绍Q-learning和DQN
全部评论

相关推荐

又是超过一小时的拷打,感觉这次挺综合的,八股、语言、大数据全都问了一遍1. 项目拷打,主要问我的项目为什么采用Hive Transform这种比较小众的方案,我的回答感觉他还是比较满意的2. 简述至少3种常见的排序算法,时间复杂度,稳定性3. 关系型数据库的索引的常用数据结构是?选择这种数据结构的原因是?4. MySQL中什么时候会导致索引失效?5. Java线程安全的数据结构有哪些?6. ConcurrentHashMap是怎么实现的?相比于在直接在HashMap外边加锁有什么区别?7. HashMap的key可以是什么类型?有什么要求?8. 处理金额相关的数据的时候,应该如何存储?在Java中和MySQL中应该选择什么数据类型?9. Linux下如何用一条命令统计某个目录下各个子目录的占用空间大小?10. 如果把Linux换成HDFS呢?如何统计?11. 对于一个超大的HDFS系统,会有什么性能风险?有什么优化手段?12. Spark的并发度是如何控制的?在一个任务中什么情况会导致并发度变化?13. 考虑以下场景:某电商网站有一个用户表(用户id,用户所在城市)和一个订单表(订单id,下单用户id,订单金额),请(1)统计总销售额前十的城市和这些城市对应的销售额(2)统计总销售额在10万元至20万元之间的城市14. 一个表有年、月、pv三个列,要求写行专列代码,转成年、一月、二月、三月……
查看14道真题和解析
点赞 评论 收藏
分享
04-16 03:30
门头沟学院 Java
简直是夯爆了!!!1.实习项目相关问题2.详细介绍一下你做过的智能客服系统。3.你们这套系统主要的应用场景大概是怎么样的?能举个例子介绍一下。4.什么情况下需要用到你的那个 expert 相关技术?5.整套系统的主要难点是在于什么地方?6.中间的 Planner,它的规划机制是怎么样的?比如它底层需要调用哪些工具?是不是需要多轮规划?中间的一些详细设计是怎么设计的?7.你们怎么去评估客服对客户的输出是好还是坏?8.搜索功能是怎么实现的?9.你在中间起到的主要作用是什么?你做出了什么改进?10.你这个迭代的过程中,有 ground truth 吗?比如每一个 query 实际上最终最相关的商品是有哪些?11.你中间做了一些什么样的技术迭代?最终体现在人工评估指标上有什么样的提升?有做过对比吗?12.这个人工评估的指标是怎么设计的?最后它的指标结果怎么样?13.这个指标结果是内部人工评估的,还是线上的结果?14.中间优化的过程中,你们用的是一个什么样的模型?15.你的那个 expert 模型,怎么去训练的?样本从哪里来?16.导购场景的数据是真实的用户跟人工客服对话的场景数据吗?17.训练的样本量大概是多大?18.1000 条样本就足够训练你的这个模型了吗?19.你对比过训练之前跟训练之后,同样的问题模型学习后的能力提升大概有多少?20.你能做到比原始蒸馏出来的模型效果还强吗?21.训这个 8B 的模型用的是多大显存的?什么显卡?八股1.正常来说,1B 的模型在没有做任何量化的情况下,原始 FP 格式存储大概要占到多少显存?2.不考虑梯度的情况,单纯只考虑 Inference,把参数加载到显存里面大概要占多少显存?3.平时有用过一些量化加速的方法吗?4.常用的量化手段比如 INT4、INT8、BF,它们之间怎么做到加速的?你有了解过吗?5.FP 跟 BF 之间的区别,你了解吗?6.FP 和 BF 底层实现的区别主要在哪个地方?7.正常的 MP32 在底层数据存储上,小数是怎么表示的?手撕:有连续的 N 个正整数,随机抽出一个(不拿头尾),将其他数乱序放入 N-1 大小的数组中,找出被取出的数。要求时间复杂度 O (N),空间复杂度 O (1)。
查看28道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务