字节大模型算法岗面经

1.介绍项目(背景,框架,创新,难点,效果)
2.数据集具体信息
3.每个项目结构是怎么设计的,为什么这么设计,依据指标是什么
4.CLIP框架描述
5.它们各自的核心特征是什么
6.它们是怎么进行微调怎么去训练的
7.手撕代码:两个升序序列的合并
8.逻辑题:九个球,其中一个重,其余相等,你有一个天平,问最少几次把最重的球称出来
全部评论

相关推荐

04-30 12:02
门头沟学院 Java
攒人品中,祝大家都能拿到满意的Offer!1、你们团队的multi-agents是你自己设计的?还是你只是完成了其中的一部分?2、所以你只是做了,没有参与底层设计对吧,讲讲你在团队里日常都做什么?3、你门团队的agent端到端成功率和工具误调用率是怎么量化的?用了什么工具?怎么去进行改进的?4、我看你还有做医学语料的预处理工作,这块你们是怎么分工的?5、你刚才讲了那么多步骤,所有工作都是你一个人完成的吗?或者说你主要负责哪几个环节6、论文有很多不同的形式,你在做layout-aware parsing的时候,具体用的哪个工具去解析pdf?有没有横向对比其他工具?7、噪声剔除的工作你平时是怎么做的?技术方案是什么?能不能详细讲一下8、有多篇文章出现了重复片段,你是怎么去识别并归纳的?9、业界对chunk切分和边界修正的主流策略是什么?10、假设我现在有一个表格被切分成了两半,你怎么在众多paper中找到并纠错?11、你们做的Graph RAG用了什么工具去进行评价?12、你说的这个Graph里的三元组使用LLM去进行抽取的吗?怎么保证大模型不会因上下文过长而出现幻觉?13、那你在设计三元组的时候是人工操作还是AI?有没有用到学术界提供的映射表之类的?14、假设大模型在抽取实体的时候出现错误了,你怎么去排查?15、我看你有在Graph RAG基础上做community summary,讲一下你这个设计思路16、你怎么看待你做的这个图检索增强生成,和市面上常见的向量检索、混合检索有什么区别?17、不同的RAG有做横向对比并量化成效吗?笔试题:用AI IDE写一个工具,语言不限,要求是能准确的从给定文本提炼出关键实体,并把对应的entity、relationship、claim用标准json形式输出。
查看17道真题和解析
点赞 评论 收藏
分享
04-30 19:15
门头沟学院 Java
继续来分享下最近的面经~欢迎友好讨论,信息共享1.实习拷打2.有没有召回的准确率之类的过程指标3.评测机制是怎么构建的,评测集是怎么构建的4.人工标注的话,大概多少条呢5.你说召回率75%,那剩下的25%是什么原因呢6.第二段实习你做过多Agent的设计是吗?讲一下单Agent和多Agent的差异7.调研过程中,对一些任务编排有了解过吗8.RAG的原理如何理解9.你的prompt提示词模板怎么管理的10.每次更新有没有版本的概念11.第一段实习中的自研大模型,有没有和别的通用大模型作对比12.你们最终衡量这个项目的结果时,用什么指标衡量的13.LocalLife是你自己做的项目吗,说一下其中的function Calling完整的工作流14.如果用户的询问中命中了两个函数,那系统调用的逻辑是怎样的15.定义了几个function供大模型调用,如何设计的16.会不会出现不同function之间,描述有歧义或冲突17.function Calling和Agent的区别18.如果将你的LocalLife升级成一个Agent的体系结构,你觉得还要做哪些事19.举一个用AI编程工具完成的比较复杂的一个开发任务20.对AI代码的审查你用的是开源框架还是什么方式21.利用AI进行的模块设计中,有用到一些设计模式之类的吗22.单Agent和多Agent的使用场景23.电商场景下,会涉及到商品的图文分类,那么你会如何设计这样一个自动分类的系统24.用秒杀场景类似的思路,对Agent的很多接口调用,做一个接口限流如果要控制成本,对不同的大模型,也需要做一个差异化限流(比如轻量模型和重量模型的切换等),你有怎么样考虑思路25.秒杀场景的不超卖用的什么方案26.Agent中的长期记忆和短期记忆你是如何理解的
查看26道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务