Lora参数详解下
点赞 评论

相关推荐

05-08 17:04
已编辑
浙江大学 算法工程师
面试问题:- (针对简历提问)你工作里主要关注哪些指标?解释一下AUC含义、计算和作用- 主流的开源大模型结构有哪些?(prefix decoder,casual decoder、encoder-decoder)- 介绍一下layernorm和batchnorm的区别?- 在机器学习里,怎么处理长尾数据和多峰数据?- 怎么解决模型的冷启动问题,你觉得LLM在冷启动方面能够起到什么作用?- 介绍一下常见的优化算法(SGD ->Adagrad ->RMSProp ->Adam -> AdamW)?优缺点- 为什么Adam不一定最优而SGD最优的?怎么理解分析?- (针对简历提问)你工作里的对比损失是怎么构造的,有什么作用?介绍常见的对比损失的公式。代码题:- 数组第K大。给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。(力扣215原题)- 手写对比损失的计算(结合项目),并简单说了一下原理。(大概写出来就好)二面我这个是交叉面,提问的有部分设计大模型,也当然我简历上有大模型,所以问了一些llm+搜推的内容,但这部分交叉问题比较浅,能说个大概就很好,同时也有很多经典的机器学习面经问题。因为项目里提到了对标学习,所以面试官在代码考核部分让我写个示例,所以写进简历的一定要准备好(包括流程步骤,代码实现大概要清楚)。面广告算法的岗位,机器学习面经暴率很高,建议熟背,就算是看过有印象,问到的时候也会基本很稳。
点赞 评论 收藏
分享
面的是字节的国际电商部门感觉是卷中卷了被狠狠拷打了😭面试问题:- 解释一下ROC曲线与PR曲线的关系、ROC曲线与PR曲线的适用场景- 介绍一下贝叶斯定理(贝叶斯公式和全概率公式)- 考了一个概率题:已知一个随机发生器,生成 0 的概率为  p ,生成 1 的概率为  1 - p 。请构造一个新的随机发生器,使其生成 0 和 1 的概率均为 1/2。- (针对简历提问)了解矩阵分解吗 MF、LFM吗- 训练模型的时候,怎么才能知道模型是不是过拟合了?除了看训练集和测试集的准确率,还有哪些方法可以防止过拟合?比如正则化、交叉验证这些,能不能展开讲讲怎么用?- 推荐系统里老听到CTR预估和序列推荐模型,讲讲这些模型是干啥的?比如DIN、DIEN这些CTR模型是怎么捕捉用户兴趣的?还有GRU4Rec、Caser这些序列模型是怎么处理用户行为序列的?它们各自解决了什么问题?代码题:- 给定整数数组 nums,求最大和的连续子数组,并返回该最大和。(最大子数组和LeetCode53)- 手写一个二分类交叉熵bce,使用np(只把bce的公式写出来了,然后拷打怎么计算梯度,最好熟悉一下二分类梯度怎么回传的,被拷打到了这里)一面一般是组内员工,平时比较忙,这场面试约在的中午11点,所以如果能够把你的项目介绍得详细一点,就容易不让面试官问太多问题,一般我大概是2-3min自我介绍,然后再10min介绍一个项目(2-3个项目说完差不多就去一大半面试时间了),然后最后面试官不是主动型+忙着去吃饭,就会问些常见的面经,然后碰巧见过的爆率很高,然后直接吟唱。这里拷打了概率类型的问题,印象里至少有4/32次面试提到了类似的概率场景题目,建议也是稍微复习一下,至少看看基础的内容。国际电商(tiktok)据说晋升不错(同时也卷),毕竟是出海业务,但是是真的难进(听说很多清北大佬都挂了),不太懂想要招什么人(岗位名额实在太少)  
查看8道真题和解析 面试问题记录
点赞 评论 收藏
分享
牛客网
牛客企业服务