2023-08-04 17:41 科大讯飞_星火_算法

关注

字节风控算法

1. 问项目 15分钟
2. 过拟合怎么解决，l1 l2正则的区别 l2导数是什么
3. Dropout训练和测试区别
4. 优化器有哪些，详细讲一讲
5. 怎么筛选特征
6. 机器学习模型了解吗，树模型，线性模型
7. 场景题，怎么识别抖音刷赞行为
8. 代码非递归进行中序遍历

估计是寄了转开发很久了八股快忘完了

全部评论

推荐最新楼层

感性的奇亚籽选钝角

浙江大学反欺诈/风控算法

上次被问了刷单问题

点赞回复分享

发布于 2024-04-20 17:42 广东

牛客212908978号

杭州之江专修学院算法工程师

论文作用大吗？

点赞回复分享

发布于 2023-11-01 11:17 浙江

广州市越秀区明德实验学校数据库工程师

请问uu哪个bu

点赞回复分享

发布于 2023-08-12 14:37 广东

草莓果酱ywj

哈尔滨工业大学自然语言处理

大佬过了嘛

点赞回复分享

发布于 2023-08-08 18:20 黑龙江

武汉大学 C++

哪个部门啊

点赞回复分享

发布于 2023-08-07 08:52 上海

04-14 08:49

广西大学算法工程师

Shopee AIGC 一面

1. 自我介绍2. 说说你简历上这俩项目3. 多头注意力真正发挥作用的关键，不是“头变多了”而是什么多头注意力的核心不是把一个注意力拆成几份，而是把表示空间分成多个子空间，让不同 head 在不同投影下学习不同相关性模式。有的 head 偏局部词法关系，有的偏远距离依赖，有的偏结构性边界，有的偏位置模式。如果只是单头，模型只能在一个统一度量空间里做相关性匹配，表达会更受限。真正让多头有效的，不是“并行”两个字，而是不同头通过不同参数矩阵形成了多视角关系建模。头数继续增大并不一定更好，因为维度被切得过细后，每个头的表达能力又会下降，所以它本质上是容量分配问题，不是机械堆头数的问题。4. 为什么推...

AI-Agent面试实战...

点赞评论收藏

分享

04-16 15:57

香港科技大学（广州）算法工程师

字节跳动风控算法一面

一、面试问题A. 项目经历与业务理解1. 实习1. 先介绍一下你的这段实习经历。2. 听起来你的工作主要集中在数据/样本构建上，是吗？3. 你这里写了 VQG 和 VQA 一致性评估，这里的“一致性评估”是什么意思？4. 所以你的意思是，让大模型先生成问题，再生成答案，然后看问题和答案是否对得上，是吗？5. 所以最后是不是回答不一致的样本，就说明它比较难？6. 这个项目过程中，你有做过哪些模型方面的工作？2. LLM-as-a-Judge 项目7. 研究生阶段你还有一个 LLM-as-a-Judge 的项目，能大概介绍一下吗？8. 你最后这个总分好不好，是通过一个下游任务来验证的吗？9. 如果我理解得对，就是你打分之后选 Top 20% 的数据去微调，再和随机选 20% 做对比，是这个意思吗？10. 这个事情听起来很像样本选择，甚至有点像强化学习，你有从这个方向考虑过吗？B. 强化学习基础11. 你对强化学习了解吗？系统地学习过一些强化学习的方法吗？12. on-policy 和 off-policy 分别是什么意思？13. importance sampling 是什么？14. DPO 和 PPO 是什么关系？它们有什么区别？C. LoRA / 参数高效微调（这里因为我简历写了一个LoRA所以面试官追着来杀）15. 你在项目里用 BLIP-2 做了 LoRA 微调。LoRA 为什么可以省显存？16. 你虽然加的是一个低秩小矩阵，但不管多小，参数总归是增加了。那为什么在参数增加的情况下，LoRA 反而还能省显存？17. 推理的时候呢？推理阶段用 LoRA 和不用 LoRA，有什么区别？效率上有什么影响？D. 多模态模型 / VLM1. BLIP-2 相关（因为LLM-as-a-Judge里面提到了这个细节）18. 你为什么选择 BLIP-2 做微调？选择 BLIP-2 的考虑是什么？19. BLIP-2 相对于 BLIP 有什么改进？2. VLM 路线理解20. 你对 VLM 这条线还有哪些了解？之前有关注过哪些相关工作？21. Qwen VL 了解吗？22. 相比于 LLaVA，Qwen-VL 有哪些不一样的地方？你有没有了解过？E. Transformer / 大模型基础23. Position Encoding 是什么？有哪些分类？24. 旋转位置编码、绝对位置编码，是直接加到 token embedding 上的吗？25. 相对位置编码呢？比如 RPE 这种，它一般是加到哪里？26. decoder 里面 causal attention 是怎么实现的？F. 手撕：最长不重复子串二、反问1. 部门目前主要负责的业务内容是什么？团队主要在做哪些事情？部门整体是做风控的，负责平台上的各类风险问题。大的方向包括内容风险，比如违规图片、违规文本；也包括用户层面的欺诈、作弊等风险。具体到他们团队，主要做几类事情：一类是机器作弊流量和攻击检测，比如爬虫、自动化攻击、人工获取数据等；一类是人机验证相关能力，比如真人检测、验证码等还有一类是识别图片、文本里隐藏得很深的网址，并判断这些网址的风险，这些网址往往会把用户引到站外赌博、色情等高风险网站。2. 这个岗位平时更 focus 哪些算法领域？更希望候选人掌握哪些知识、算法方向和工程经验？首先还是需要有大模型基础，对大模型的一些基础概念和原理要比较了解。其次，像他们做隐藏网址识别这类任务，如果输入是图片、图文、视频，本质上就是一个 VLM 问题，所以也会希望候选人具备多模态/VLM 方面的理解。还有一块是 Agent，因为他们现在也在探索用 Agent 节省人力、提高效果，所以这方面也有需求。至于为什么会追问 RL，是因为 Agent 往底层看，算法基础还是会和 RL 有关系，所以他们对这方面也是有期待的。3. 这个部门属于哪个业务？是抖音还是 TikTok 相关？会和哪些部门合作？这个部门属于 Data，可以理解成字节的中台部门。风控相关的很多需求会收在他们这里，所以也可以把他们理解成风控中台。抖音和 TikTok 两边的风控中台需求都会提到他们这里，也就是说他们同时支持抖音和 TikTok 这两边的业务。4. 这份实习是日常还是暑期？HC 情况大概怎么样？转正 HC 的情况面试官自己也不太确定，目前应该还没有完全定下来，这块后续可以再和 HR 沟通。实习本身要求至少三个月，团队会更希望实习时间长一点，因为前期熟悉业务和环境本身就要花不少时间，太短的话不利于真正做出产出。5. 团队里做的内容主要是业务算法 / pipeline 搭建，还是也会有研究课题、论文产出的可能？整体还是更偏业务，不太支持以论文为导向的事情。但也不是说让实习生直接上来扛复杂业务指标。通常的做法是从复杂业务问题里，抽取出一个相对独立、偏技术、带一些探索性的点，让同学在这个方向上做出产出。所以更偏“从业务中抽技术问题来做”，而不是纯学术研究。6. 为什么字节有些组会支持论文或者研究产出，但你们组看起来不太支持？是岗位性质不一样吗？这个团队是要为业务结果负责的，所以判断标准首先是对业务有没有帮助。面试官比较直接地表达了他的看法：很多论文并不能真正解决业务问题，甚至会被视为“水论文”。他们并不是完全排斥研究，而是强调如果某个具体业务问题确实值得研究、也确实需要前沿技术去解决，那么可以研究；但最终目标仍然应该是服务业务、能落到线上，而不是为了论文本身去做。7. 这轮面试之后，我大概多久能知道结果？正常情况下大概三天之内会有结果，但最终还是要看后续 HR 推流程的节奏陪一张昨天下午在教室拍的一角夕阳

点赞评论收藏

分享

03-29 00:13

广西大学算法工程师

阿里 AI Agent 开发二面

1. 大语言模型的 RLHF 训练流程是什么，它存在哪些潜在风险RLHF 一般分三步。第一步是 SFT，用高质量指令数据把基座模型调成能听懂任务、按格式回答的模型。第二步是训练奖励模型，把人工偏好数据整理成 chosen 和 rejected 形式，让奖励模型学会判断两个回答哪个更好。第三步是强化学习优化，最经典的是 PPO，让当前策略在奖励更高的方向上更新，同时用 KL 约束避免模型偏离初始策略太远。它的风险主要在三个地方。第一，奖励模型可能学偏，模型最后学到的是“讨好奖励模型”而不是真正更有帮助。第二，强化学习阶段如果约束不够，模型容易出现 reward hacking，看起来分数高，但真...

AI-Agent面试实战...

点赞评论收藏

分享

04-04 16:49

门头沟学院 Java

4.1 阿里国际-履约表达-ai应用一面

已挂 1.自我介绍2找一个大模型项目，技术选型，技术框架等介绍下3.bge向量化模型，看过其他模型吗，对比了吗回答的不好，没准备4.向量数据库milvus里面的ANN算法5.它和传统的算法的时间复杂度是怎么样的6.rag的切分策略是什么答得递归切分，三层策略7.LLM的提示词怎么设计的答得结合业务场景，意图识别，角色限定，模型选择，query改写，8.编写提示词有哪些经验，有参考的示例吗架构师，全站工程师，测试工程师，必须，禁止等关键词9.LLM怎么跟rag结合起来的，只听到意图识别检索测和生成侧都有10.查询结果通过精排，LLM结合输出，可以简单的这样理解吗11问答的过程，记忆是怎么实现的12.短期记忆的话涉及到多轮对话，怎么进行压缩，或者说有什么其他策略吗答得近期保留，远处的对话摘要，保持知道这样一个对话13.自我介绍的时候的时候，有做过模型的训练，基于哪个预训练模型YOLOV8，V1114.数据集是什么类型的数据集，准确度能达到多少，指标15.平常用哪些语言，mysql慢查询优化，索引优化策略16.mysql主键索引一定是连续的吗17.默认的情况设定的自增吗，连续吗18.三个线程同时写msqyl数据，第一个比如主键ID为1，第二个主键ID为2，同时向一个唯一索引的写数据，1写成功了，二失败了回滚；此时第三个线程往里面插数据，这个时候第三个线程的主键ID是三还是二呢不会19.kafka消息是怎么存储的，存储的组织结构，topic下面有很多持久化文件或者说现在输入一个id，kafka根据id怎么找到持久化的一个内容20java用的哪个版本，默认垃圾回收器是什么，G1是怎么做垃圾回收的吗可以详细讲下垃圾回收算法吗21项目里面redis除了做记忆存储还有哪些作用list set做存储，bitmap做文件上传标记22redis里面是单机，还是主从还是集群呢23.redis怎么保证高可用的不会24.集群或者是主从一个机器宕机的话，怎么故障回复的；或者说主从切换怎么做的之前有了解吗25.选主策略呢，哪个从节点优选为主节点反问ai业务，业务进度清明节前会更新吗，然后秒挂跨境电商，相关的策略相关的，推荐相关的，在做探索kafka redis高可用知识不系统，后面再看看

查看27道真题和解析

点赞评论收藏

分享

03-30 20:48

门头沟学院研发工程师

一天面三场的耐面王

第一场字节，三进宫，压力还是那么的大，现场共享屏幕启动项目看流程，结果当场出bug，在这浪费了将近20min还没搞出来（其实就是提示词模版给错了，导致空指针，还是压力太大了），然后问我二开项目是不是没跑过 ,算法是判断一棵树是不是另一棵树的子树，好像是力扣原题，75min。第二场钉钉，出场景题看你思考的深度（大型qps的一个系统，要求用到磁盘，怎么优化，我的思路是redis那一套，多实例，缓存，缓存淘汰策略），跟面试官有说有笑，谈到了ai 替代程序员的话题，45min，无算法。第三场美团，这个体验最好，面试官是个同龄人，彬彬有礼，一直围绕着项目聊，对每一个点都仔细询问，有没有什么替代方案，也问...

查看7道真题和解析

点赞评论收藏

分享

评论

9

75

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你知道最慷慨和最抠的公司分别是 #

2004次浏览 24人参与

# 哪些AI项目值得做？ #

1256次浏览 33人参与

# 华泰星战营，提前锁定校招offer #

7488次浏览 307人参与

# 实习时最怕听到的一句话 #

1591次浏览 25人参与

# 简历上如何体现你的“AI”能力？ #

1566次浏览 35人参与

# 你简历上最心虚的一句话 #

6420次浏览 32人参与

# 怎么给家人解释你的工作？ #

56901次浏览 216人参与

# 找不到大厂实习可以去小厂吗？ #

1978次浏览 24人参与

# 没有面试的日子里，你在做什么 #

1708次浏览 31人参与

# 卷__卷不过你们，只能卷__了 #

60592次浏览 766人参与

# 考公VS就业，你怎么选？ #

100550次浏览 530人参与

# 哪些公司对双非友好 #

230832次浏览 1246人参与

# 你今年的保底offer是哪家 #

187538次浏览 757人参与

# 嵌入式岗知多少 #

72551次浏览 571人参与

# 国央企笔面经互助 #

196653次浏览 1234人参与

# 快消秋招求职进展汇总 #

11615次浏览 41人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

160947次浏览 904人参与

# 华为池子有多大 #

174762次浏览 914人参与

# 工作丧失热情的瞬间 #

388481次浏览 2581人参与

# 你认为哪些项目算烂大街？ #

89335次浏览 659人参与

# 商战，最累的是我们 #

31841次浏览 99人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务