2023秋招nlp算法面经

目前收获: bat两个oc一个评估中,其余互联网oc*2
积点功德,等更多oc,offer

面试oj题:
1. 字典树构建,用字典树做搜索/分词; 求平方根
2. 编辑距离,正则表达式匹配,寻找两个有序数组中位数,合并k个升序链表变体,岛屿数量,二叉树层次遍历,二叉树最大路径和,数组中第k大的元素等(lc hot100)
3. python解析json结构,正则表达式匹配(re)
4. 手撕: multihead self attention, logistic regression, layernorm(pytorch可用)

大模型:
今年nlp面试感觉逃不了大模型
1. deepspeed框架介绍
2. lora介绍,了解什么其他高效微调方法
3. prompt tuning, instruct tuning, fine tuning差别
4. llama中per norm,rmsnorm的介绍,优劣,position embedding构造方法
5. prompt构造经验,怎样的prompt更好

业务场景:
可能是本人业务经验少,问得大部分都是“从0开始构建xxx”的问题,比如“从0开始构建推荐系统”
另外,还有很多大数据场景问题,如海量数据中敏感词检测,海量任务调度等

概率题:
绝大部分都是经典题,还有大数定理,连续分布的均值方差公式,有时需要用牛莱公式算积分(ps. 拉格朗日乘子法,一阶泰勒展开要熟悉)
全部评论
寻找两个有序数组中位数,这个题太难了。但搜面经居然有,必须背😮‍💨
点赞 回复 分享
发布于 01-12 22:07 河北
m
点赞 回复 分享
发布于 2024-03-10 14:05 广东
m
点赞 回复 分享
发布于 2024-02-23 18:17 江苏
手撕逻辑回归什么的,是手撕原理还是代码呢
点赞 回复 分享
发布于 2023-11-05 00:35 湖南
问题都好难啊
点赞 回复 分享
发布于 2023-11-01 18:12 上海

相关推荐

04-08 21:42
已编辑
河海大学 Java
1.面试官自我介绍 : 美团的直播部门后端2.自我介绍八股:1.redis都什么数据结构?项目当中常用那哪几个?位图在项目中怎么用的?2.布隆过滤器的原理?3.volatile 关键词作用?有序性是怎么实现的?4.进程和线程的区别?线程是为了解决进程的什么问题?手撕:字符串大数相加反问:1.base 北京 2.AI相关 3.建议: 多巩固基础(看我撕得这么费劲)总结:面试官非常好,和我有说有笑的探讨问题,但是最近都没看算法,简单题居然吭哧吭哧写了二十分钟,面试官在我写题的时候也一直看着屏幕,也没有做其他事就看着我写,方法写错个字母还用指针点了一下帮我排除错误(我哭死)面试官很好但是我太菜,还是要好好去复习不能摆发现自己有个坏习惯,回答问题的时候眼神一直到处飘,而且频率很高,怕被误认为有其他作弊工具,牛友们也要注意一下眼神管理 许愿二面问了我的AI项目,另一个项目一句没问:1.完成度怎么样?能和运行么?跑个栗子看一下罢!2.整体的运作流程3.和Langachain4j对标的还有那些JavaAI框架?4.Manus了解过么?5.举个具体的Tool例子6.解释下Agent是什么概念?和Tool有什么区别7.大模型在Agent中起到了什么作用?过程当中会调用多个大模型么?8.LLM的具体原理?Token是怎么存的?从一个个Token到输出的过程是怎样?9.为什么要存上下文记忆?  
点赞 评论 收藏
分享
评论
11
67
分享

创作者周榜

更多
牛客网
牛客企业服务