腾讯

收藏
社交
10000人以上
上市
深圳
identity 大学生最喜爱雇主
高校必争榜offer比较常胜榜HC充足榜校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
严重性定义 产品场景下幻觉的容忍度,接受多少成本来解决评估和检测●业务角度:进行人工评估,比如标100条Case,从体感上感知主要问题●自动化评估:在垂直领域,构造数据集,利用LLM进行知识检索判断幻觉幻觉分类大致分为与真实世界信息不一致的事实性幻觉(包括编造事件、信息过时等)、与输入的上下文不一致的忠实型幻觉。需要不同的缓解措施幻觉如何缓解?调API的话1.首先是Prompt调优。比如输入更详细的任务指令、调优的过程中不断根据输出的Bad Case加入限制。比如COT。2.然后是上下文优化,这里指的可以是RAG的召回信息优化,也可以是特定场景的上下文处理优化,突出其重点部分更容易被大模型理解。3.还可以基于Agent思想,将其问题拆分成更细粒度的任务,每个步骤都使用RAG融入外部知识来降低幻觉。4.最后是成本较高的,使用另一个模型来检测幻觉,如果有幻觉则重新生成。自研模型的话,通常是在垂直场景需要蒸馏一个小模型,或者微调一个模型。除去上述部分,还可以参考一下思路1.SFT训练数据层面:通过合成指令微调,有助于缓解幻觉。2.强化学习:在强规则的领域,可以通过强化学习来缓解忠实型幻觉。比如特定格式输出、特定内容提取等。3.推理:在不同领域考虑不同的解码方式,多样性解码在专业领域诱发更多幻觉,贪心搜索在开放领域加剧幻觉
查看9道真题和解析
点赞 评论 收藏
分享
二面: 1. 介绍部门的一些相关情况询问兴趣2. 算法题1:去除不定长字符串的所有空格(刚开始用了个stringbuilder,面试官说不行。后来用字符数组移位置。)3. 算法题2:有两个文件,判断第二个文件是否包含第一个文件的全部内容(这里用哈希表先存了第一个文件的词频然后第再去遍历第二个文件,逐个取出)4. java八股1:说说string,stringbuilder和stringbuffer的区别5. java八股2:如何用hashmap实现hashset6. java八股3:序列化和反序列化,一般怎么使用,在哪些场景使用7. 运维相关1:你解决过线上的oom问题吗(?这种问题正式工一年都不一定能碰到几次吧),一般有什么思路(稍微背了一点八股,面试官说没排查过就算了)8. 运维相关2:cpu飙高问题(这里我也是背八股)9. 运维相关3:死锁和接口返回时间过长如何排查(到这里我就有点不理解了,不看日志这种线上怎么排查)。火焰图?然后这块也是没太了解过10. 实习相关1: 你觉得技术上最有成长的是什么?(这里我说了一大堆跟java无关的,因为我现在实习项目确实跟java关系不大了)11. 实习相关2: vibe coding你的采纳率有多少?(我说一半一半吧,跟提示词和模型本身都有关系)问了太多这种线上问题了,纯属知识盲区。不懂这个部门做数据的为什么会这么强调线上问题。ps:面试结束后想了一下算法1,不定长应该指的是没有边界,意思是从输入值我就错了,不应该是字符串而是数据流,所以应该这样写。```javapublic static void removeSpacesStreaming(Reader reader, Writer writer) throws IOException {int c;while ((c = reader.read()) != -1) {if (!Character.isWhitespace(c)) {writer.write(c);}}}```一面:1. 算法题:无重复字符的最长子串2. 用过什么大模型:llama3和qwen3. 然后就按简历一条一条的问,蜻蜓点水也不深入4. 八股就只有redis的缓存三件套
查看15道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务