字节 风控算法

1. 问项目 15分钟
2. 过拟合怎么解决,l1 l2正则的区别 l2导数是什么
3. Dropout训练和测试区别
4. 优化器有哪些,详细讲一讲
5. 怎么筛选特征
6. 机器学习模型了解吗,树模型,线性模型
7. 场景题,怎么识别抖音刷赞行为
8. 代码 非递归进行中序遍历

估计是寄了 转开发很久了 八股快忘完了
全部评论
上次被问了刷单问题
点赞 回复 分享
发布于 2024-04-20 17:42 广东
论文作用大吗?
点赞 回复 分享
发布于 2023-11-01 11:17 浙江
请问uu哪个bu
点赞 回复 分享
发布于 2023-08-12 14:37 广东
大佬过了嘛
点赞 回复 分享
发布于 2023-08-08 18:20 黑龙江
哪个部门啊
点赞 回复 分享
发布于 2023-08-07 08:52 上海

相关推荐

一、面试问题A. 项目经历与业务理解1. 实习1. 先介绍一下你的这段实习经历。2. 听起来你的工作主要集中在数据/样本构建上,是吗?3. 你这里写了 VQG 和 VQA 一致性评估,这里的“一致性评估”是什么意思?4. 所以你的意思是,让大模型先生成问题,再生成答案,然后看问题和答案是否对得上,是吗?5. 所以最后是不是回答不一致的样本,就说明它比较难?6. 这个项目过程中,你有做过哪些模型方面的工作?2. LLM-as-a-Judge 项目7. 研究生阶段你还有一个 LLM-as-a-Judge 的项目,能大概介绍一下吗?8. 你最后这个总分好不好,是通过一个下游任务来验证的吗?9. 如果我理解得对,就是你打分之后选 Top 20% 的数据去微调,再和随机选 20% 做对比,是这个意思吗?10. 这个事情听起来很像样本选择,甚至有点像强化学习,你有从这个方向考虑过吗?B. 强化学习基础11. 你对强化学习了解吗?系统地学习过一些强化学习的方法吗?12. on-policy 和 off-policy 分别是什么意思?13. importance sampling 是什么?14. DPO 和 PPO 是什么关系?它们有什么区别?C. LoRA / 参数高效微调(这里因为我简历写了一个LoRA所以面试官追着来杀)15. 你在项目里用 BLIP-2 做了 LoRA 微调。LoRA 为什么可以省显存?16. 你虽然加的是一个低秩小矩阵,但不管多小,参数总归是增加了。那为什么在参数增加的情况下,LoRA 反而还能省显存?17. 推理的时候呢?推理阶段用 LoRA 和不用 LoRA,有什么区别?效率上有什么影响?D. 多模态模型 / VLM1. BLIP-2 相关(因为LLM-as-a-Judge里面提到了这个细节)18. 你为什么选择 BLIP-2 做微调?选择 BLIP-2 的考虑是什么?19. BLIP-2 相对于 BLIP 有什么改进?2. VLM 路线理解20. 你对 VLM 这条线还有哪些了解?之前有关注过哪些相关工作?21. Qwen VL 了解吗?22. 相比于 LLaVA,Qwen-VL 有哪些不一样的地方?你有没有了解过?E. Transformer / 大模型基础23. Position Encoding 是什么?有哪些分类?24. 旋转位置编码、绝对位置编码,是直接加到 token embedding 上的吗?25. 相对位置编码呢?比如 RPE 这种,它一般是加到哪里?26. decoder 里面 causal attention 是怎么实现的?F. 手撕:最长不重复子串二、反问1. 部门目前主要负责的业务内容是什么?团队主要在做哪些事情?部门整体是做风控的,负责平台上的各类风险问题。大的方向包括内容风险,比如违规图片、违规文本;也包括用户层面的欺诈、作弊等风险。具体到他们团队,主要做几类事情:一类是机器作弊流量和攻击检测,比如爬虫、自动化攻击、人工获取数据等;一类是人机验证相关能力,比如真人检测、验证码等还有一类是识别图片、文本里隐藏得很深的网址,并判断这些网址的风险,这些网址往往会把用户引到站外赌博、色情等高风险网站。2. 这个岗位平时更 focus 哪些算法领域?更希望候选人掌握哪些知识、算法方向和工程经验?首先还是需要有大模型基础,对大模型的一些基础概念和原理要比较了解。其次,像他们做隐藏网址识别这类任务,如果输入是图片、图文、视频,本质上就是一个 VLM 问题,所以也会希望候选人具备多模态/VLM 方面的理解。还有一块是 Agent,因为他们现在也在探索用 Agent 节省人力、提高效果,所以这方面也有需求。至于为什么会追问 RL,是因为 Agent 往底层看,算法基础还是会和 RL 有关系,所以他们对这方面也是有期待的。3. 这个部门属于哪个业务?是抖音还是 TikTok 相关?会和哪些部门合作?这个部门属于 Data,可以理解成字节的中台部门。风控相关的很多需求会收在他们这里,所以也可以把他们理解成风控中台。抖音和 TikTok 两边的风控中台需求都会提到他们这里,也就是说他们同时支持抖音和 TikTok 这两边的业务。4. 这份实习是日常还是暑期?HC 情况大概怎么样?转正 HC 的情况面试官自己也不太确定,目前应该还没有完全定下来,这块后续可以再和 HR 沟通。实习本身要求至少三个月,团队会更希望实习时间长一点,因为前期熟悉业务和环境本身就要花不少时间,太短的话不利于真正做出产出。5. 团队里做的内容主要是业务算法 / pipeline 搭建,还是也会有研究课题、论文产出的可能?整体还是更偏业务,不太支持以论文为导向的事情。但也不是说让实习生直接上来扛复杂业务指标。通常的做法是从复杂业务问题里,抽取出一个相对独立、偏技术、带一些探索性的点,让同学在这个方向上做出产出。所以更偏“从业务中抽技术问题来做”,而不是纯学术研究。6. 为什么字节有些组会支持论文或者研究产出,但你们组看起来不太支持?是岗位性质不一样吗?这个团队是要为业务结果负责的,所以判断标准首先是对业务有没有帮助。面试官比较直接地表达了他的看法:很多论文并不能真正解决业务问题,甚至会被视为“水论文”。他们并不是完全排斥研究,而是强调如果某个具体业务问题确实值得研究、也确实需要前沿技术去解决,那么可以研究;但最终目标仍然应该是服务业务、能落到线上,而不是为了论文本身去做。7. 这轮面试之后,我大概多久能知道结果?正常情况下大概三天之内会有结果,但最终还是要看后续 HR 推流程的节奏陪一张昨天下午在教室拍的一角夕阳
点赞 评论 收藏
分享
04-04 16:49
门头沟学院 Java
已挂 1.自我介绍2找一个大模型项目,技术选型,技术框架等介绍下3.bge向量化模型,看过其他模型吗,对比了吗回答的不好,没准备4.向量数据库milvus里面的ANN算法5.它和传统的算法的时间复杂度是怎么样的6.rag的切分策略是什么答得递归切分,三层策略7.LLM的提示词怎么设计的答得结合业务场景,意图识别,角色限定,模型选择,query改写,8.编写提示词有哪些经验,有参考的示例吗架构师,全站工程师,测试工程师,必须,禁止等关键词9.LLM怎么跟rag结合起来的,只听到意图识别检索测和生成侧都有10.查询结果通过精排,LLM结合输出,可以简单的这样理解吗11问答的过程,记忆是怎么实现的12.短期记忆的话涉及到多轮对话,怎么进行压缩,或者说有什么其他策略吗答得近期保留,远处的对话摘要,保持知道这样一个对话13.自我介绍的时候的时候,有做过模型的训练,基于哪个预训练模型YOLOV8,V1114.数据集是什么类型的数据集,准确度能达到多少,指标15.平常用哪些语言,mysql慢查询优化,索引优化策略16.mysql主键索引一定是连续的吗17.默认的情况设定的自增吗,连续吗18.三个线程同时写msqyl数据,第一个比如主键ID为1,第二个主键ID为2,同时向一个唯一索引的写数据,1写成功了,二失败了回滚;此时第三个线程往里面插数据,这个时候第三个线程的主键ID是三还是二呢不会19.kafka消息是怎么存储的,存储的组织结构,topic下面有很多持久化文件或者说现在输入一个id,kafka根据id怎么找到持久化的一个内容20java用的哪个版本,默认垃圾回收器是什么,G1是怎么做垃圾回收的吗可以详细讲下垃圾回收算法吗21项目里面redis除了做记忆存储还有哪些作用list set做存储,bitmap做文件上传标记22redis里面是单机,还是主从还是集群呢23.redis怎么保证高可用的不会24.集群或者是主从一个机器宕机的话,怎么故障回复的;或者说主从切换怎么做的之前有了解吗25.选主策略呢,哪个从节点优选为主节点反问ai业务,业务进度清明节前会更新吗,然后秒挂跨境电商,相关的策略相关的,推荐相关的,在做探索kafka redis高可用知识不系统,后面再看看
查看27道真题和解析
点赞 评论 收藏
分享
评论
9
75
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务