sys 主要是 python解释器和系统环境之间的交互,例如处理输入输出之类的,例如sys.version
点赞 评论

相关推荐

03-16 12:02
已编辑
门头沟学院 算法工程师
深度学习算法工程师,cpp开发工程师,agent开发工程师面试经验深度学习八股一、深度学习八股1. 什么是过拟合?怎么解决训练集效果远远大于测试集,启用L1,L2正则化,提高dropout率,批次归一化等等2. 什么是欠拟合?怎么解决训练集和测试集效果均不好,减少dropout率,通过注意力机制增驾网络复杂度3. 梯度消失和梯度爆炸原因是什么?非线性激活函数导致梯度上升和下降,例如relu可能导致梯度消失等等4. RELU和sigmoid的是什么?明确两者的表达式5. 什么是反向传播,介绍一下梯度反向传播数据流正向传播,为了让目标变小,最终函数对网络参数求导Δw,为了减少目标函数w=w-Δw6. 什么是损失函数?分类和分割常用那些?为了帮助我们达到我们的目标。分类准确率,分割常用损失交叉熵7. 分类任务和分割任务你认为区别在哪里?解码器的最后部分不同,分割本质是像素级别的分类。分类是泛泛整体的分割8. dropout原理是什么?有什么用一定比例神经元失活9. 卷积层的作用是什么提取感受野范围内特征10. 池化层的作用是什么?什么是平均值池化,什么是最大值池化根据感受野内内容进一步提取特征,求感受野平均值,最大值11. 什么是注意力机制?注意力机制有什么用?帮助我们捕获需要关注的特征,忽略次要特征12. 你的注意力机制如何设计的?并行融合通道注意力机制和空间注意力机制13. 残差网络好,为什么要利用残差网络?残差网络作用融合浅层特征,避免梯度消失,梯度爆炸14. 什么是连通性?单连通和多连通分别是什么闭合曲线就是连通的,中间部位有无其他区域被分为单联通和多连通15. 训练神经网络的时候,如何选择学习率初始学习率较高,进行后学习率降低。加速收敛,寻找最优值16. 一个深度学习的分割项目都包括那些环节?数据集预处理,神经网络搭建,损失函数,评价指标选择,后处理17. 各个环节都有什么用途预处理,进行数据增强,提高网络鲁棒性神经网络,提取归纳特征完成任务损失函数,确定任务目标评价指标,评价模型好坏后处理,进一步处理,提高评价指标18.什么是Unet网络?u型网络,结果包括编码器解码器,编码器不断卷积池化进行特征提取,解码器不断接受跳跃连接和上采样,卷积进行解码19. 损失函数是什么,如何设计的bce和dice表达式,如何联合20. 常见的后处理操作如何设计根据数据集特点,单连通区域,几个目标,目标间的关系等等21. L1和L2正则化有什么用l1,l2公式明确,减少参数复杂题,防止过拟合,22. 如何评估模型结果的好坏通过评价指标的高低来评价模型的好坏23. 什么是准确率tp+tn/(tp+tn+fn+tn)24. 什么是精确率所有预测为真当中真的为真的概率: tp/(tp+fp)25. 什么是召回率所有真当中预测为真概率: tp/(tp+fn)26. 什么是混淆矩阵真实为真,真实为假预测为真: tp,fp预测为假: fn,tn27. 一般如何进行数据增强旋转,平移,镜像,随机裁剪等变换其他1. 你认为你的项目都用到了什么?残差网络,混合注意力机制,混合损失函数,后处理设计2. 你认为你用的这些模块有什么用?残差网络: 融合浅层特征,避免梯度消失或者爆炸混合注意力机制:让我们更加关注值得关注的特征,忽略次要特征混合损失函数:联合dice+iou,对于正类分割效果加强后处理:找到数据集的特点,针对数据集的特点进行设计,利用连通性(单、多),大小,主次要病灶等手段3. 你用了什么评价指标?iou,dice,精确率,召回率,准确率4. 你的效果大概提升了多少?自己实际情况cpp开发八股cpp基础1. malloc与new区别返回值有无类型2.cpp的特点封装继承多态封装类子类继承父类,public,private,protect不同类型3.指针悬空 内存泄露指针释放,内容没有释放,空间消失,指针还在4.智能指针自定取消指针5.分区——内存分区四分区模型计算机网络6. udp/tcp划分安全与快速性 握手与挥手7. 7层模型物理层,数据链路层……8. http信号http和https区别数据结构9. 线性结构,非线性结构链表,线性表,堆栈,队伍树,图10. dfs,bfs 树图递归算法11. 递归,stack处理括号匹配数据库相关知识agent开发1. agent都有什么类型reflect,reaction,plan-action等等2. agent组成llm,prompt,momery,tool3.开发框架langgraph(非可视化),dify(可视化)4. prompt组成系统prompt+用户+记忆5. langgraph数据状态在图之间流动6. 如何设计并发通过时间循环执行异步函数实现并发7. Python后端框架Flask,djingo8. 前端框架vue,html,JavaScript9.如何管理记忆短期记忆,长期记忆10.如何进行rag,数据增强余弦相似度匹配,向量匹配11.如何微调模型SFT+RL如何设计的项目1. 分为七段式提取pdf内容指定内容,内容需求分类,保存数据库,与已有内容对比去重设计文本粗分块,文本细分块2. 如何设计agent,mcp链接langchain,mcp链接dify,链接飞书机器人3.lora微调大模型针对特定分类任务,4.搭建串级模型,微调大模型+通过大模型prompt手撕,括号匹配,单词接龙,链表,冒泡,快排,图,动态规划
点赞 评论 收藏
分享
自我介绍以后开始拷问:项目:1,如何做到筛选视频困难样本的(只有这个答得有点曲折,也记不清项目里面是怎么做的了,其他答得还好的都记不清了,后面也知道了这个经历和公司业务内容强相关)八股:A。面试官说先从Python基础问起(问之前还确认了我用C还是用Python):1,Python里面可变对象跟不可变对象的一个区别,及其含义,以及模型训练当中怎么用2,Python里面可变对象包括什么,元组算不算可变对象3,对上一个的follow up:可变对象和不可变对象的本质区别?也即list能不能作为哈希表的key?(可能因为上一个问题答得隔靴搔痒没有切中面试官的心意)4,什么是全局解释器锁GIL,在这种情况下怎么进行多线程编程5,什么情况下会用多进程什么时候会用多线程6,多进程之间做并发的话怎么去做数据共享以及同步互斥(一开始自己回答了Lock,后来面试官提示是多线程之间做的并发,于是端上了Event和Semaphore Quene等)7,了解过Python装饰器的作用吗,在代码里面有没有用过,它的原理是什么8,Python在数据处理当中常见的性能优化手段9,10个T的视频数据浏(浏览数据或者点赞数据),想去统计这些数(每个视频的观看人数和点击人数)。这个东西用Python来写的话,会怎么去写(后续补充:在本地的机上面处理,而不是说用分布式那种那个来处理。10个T还不至于一定要上分布式)B,计网:1,HTTP跟HTTPS区别和联系C,数据库1,了解数据库事务吗,简单讲讲2,LEFT JOIN 和INNER JOIN的区别(但是本人对数据库实在不熟不知道有没有听错问啥……)D,大模型Transformer里面会用那个Flas Attention跟那个Paged Attention去优化,它们的那个区别跟那个原理是什么代码手撕:最长回文子串,不过是直接返回子串面试官看我补全代码以后捉了点bug就没说别的了,问了问时间复杂度以及有没有比动归更好的解法(此外我听过一个说法,说如果面试官直接问你hot100原题就是很想招你进来了,我不清楚)反问环节:1,这个实习岗位具体做什么?业务场景是什么?——主要围绕 TikTok 直播的音视频内容理解与标签体系建设。在连麦、试音等场景下,对内容进行识别后自动打玩法/分类/风格等标签。目标是提升标签质量(准确率/覆盖率等)并推动自动化。工作会包含线上推理服务与工程链路设计,配合策略/算法团队做模型与策略调优2,使用什么模型对数据打标签?开源还是闭源?——同时会做开源与闭源大模型的对比实验,效果好的方案会通过实验与切流获得更多流量。根据内容来看感觉这个应该是加了AI调用和提示词工程的python后端开发,整体更偏工程,也无怪乎大模型这块也就问了这么点btw喜茶的提拉米苏浓巧好喝
查看17道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务