5月大模型面试必问八股文,背完通过率98%

全部评论
大佬求资料
1 回复 分享
发布于 2025-07-27 02:19 广东
大佬,求八股资料
1 回复 分享
发布于 2025-07-24 12:01 重庆
大佬,求八股资料
1 回复 分享
发布于 2025-07-23 10:48 北京
求八股文,大佬
1 回复 分享
发布于 2025-07-18 13:44 广东
大佬,求八股资料
1 回复 分享
发布于 2025-07-14 15:28 浙江
大佬,求八股资料
1 回复 分享
发布于 2025-07-05 16:32 湖北
求八股大佬
1 回复 分享
发布于 2025-06-27 19:07 四川
求八股大佬
1 回复 分享
发布于 2025-06-24 23:44 四川
大佬,求八股资料
1 回复 分享
发布于 2025-06-16 14:13 湖北
求资料
1 回复 分享
发布于 2025-06-11 15:35 北京
大佬求资料
1 回复 分享
发布于 2025-06-04 14:44 江苏
大佬求资料
1 回复 分享
发布于 2025-06-03 16:24 吉林
大佬,求八股资料
1 回复 分享
发布于 2025-06-01 09:39 北京
大佬求资料
1 回复 分享
发布于 2025-05-29 19:17 河南
大佬,求八股资料
1 回复 分享
发布于 2025-05-20 15:15 北京
大佬,求八股资料
1 回复 分享
发布于 2025-05-16 10:22 上海
大佬,求八股资料
1 回复 分享
发布于 2025-05-10 15:07 湖南
1 回复 分享
发布于 2025-05-08 18:51 江苏
mark
1 回复 分享
发布于 2025-05-08 16:19 黑龙江
面经求求
1 回复 分享
发布于 2025-05-05 16:06 重庆

相关推荐

1.自我介绍;2.本科毕设项目介绍;3.Retinaface和Facenet的具体网络模型;4.Retinaface是如何检测人脸的,Facenet是如何识别人脸的;5.项目的创新点有什么,评判指标是什么;6.检测和识别用的时间,其中esp8266,mg996r分别是做什么用的;7.大模型量化比赛项目介绍;8.AWQ和GPTQ是什么;9.什么模型适合用AWQ,什么模型适合用GPTQ;10.其中最优的参数是怎么得到的;11.llm- benchmarker怎么用的,是什么评判指标;12.了解算子吗?(marlin kernel)详细说一下这个算子是什么;13.除了量化其他的方法了解吗?(压缩、减枝、LoRA)14.LoRA是什么;QLoRA是什么?为什么要用LoRA;15.具体的原理是怎么样的;16.如何将LoRA结合到TransFormer各个层?17.介绍一下TransFormer的架构;18.Encoder和Decoder是由什么组成的;19.MHA细节是怎么样的(QKV),softmax是干什么用的;20.单头注意力和多头注意力有什么区别;21.为什么MHA下面要除根号d;22.潜在多头注意力了解吗,多头注意力的作用;23.FFN详细说一下;24.残差链接有什么用;25.Layer Normalization有什么用;26.Layer Normalization和Batch  Normalization的区别;27.Qwen3的基础架构是怎么样的;28.Qwen3和Qwen2.5相比有什么区别;29.Qwen3和DeepSeek有多少个头;30.大模型要训练出思维链应该如何训练;31.如何平衡精度和推理速度,怎么做trade off的;32.了解Agent吗,做过什么agent项目33.Dense模型是什么;34.MoE、MLA是什么,详细讲一下;35.LoRA的偏置矩阵详细说一下,为什么LoRA初始化A要正态分布,B要初始化为0;36.秩是什么意思;怎么理解;37.Qwen3哪里做的好;38.快手实习项目介绍;39.经纬恒润实习项目介绍;40.了解量化交易吗;41.你平时做交易是趋势还是阶段?
你最近因为什么迷茫?
点赞 评论 收藏
分享
1.GAN和Transformer 这两个分别在你的项目里承担了哪些作用?这两个是怎么帮助你推动模型进行图像或者视频重建并提升性能?2.你的GAN以及生成器和判别器主要负责什么工作的,讲一下他们的核心作用以及怎么协同的3.你做项目的时候是先用的生成器还是判别器,为什么要这样设计呢?4.你的轻量化参差模块在优化Swin transformer发挥的什么作用?5.计算机视觉中多尺度融合是什么含义6.为什么深层次神经网络中提取的图像特征被称为”语义特征”?怎么处理图片信息的,多尺度特征的提取怎么提升的模型性能,你用了什么技术和算法框架去实现的7.在你处理模型时用的什么注意力机制,在大模型图像处理项目时这些模块在整体架构分别承担了什么职责?8.你在里面用的对抗损失函数怎么设计的,怎么结合别的模块使用的9.你用的WGAN,他和原始的GAN是怎么改进梯度问题的,以及损失函数中梯度惩罚项怎么实现的Lipschitz约束10.你说一下逻辑回归他的原理还有适用场景以及如何实现的11.在逻辑回归中,我们一般用交叉墒损失函数,你可以说一下为什么吗?12.你结合一下逻辑回归二分类任务,说一下为什么这种情况经常使用交叉墒损失而不是均方误差损失呢?13.L1L2正则化在机器学习模型中的作用是什么(这里要求写数学公式)14.请详细介绍一下PPO这个在强化学习中的策略优化算法,主要思路和流程是什么15.在PPO的算法损失函数中,有两个操作,一个是clip,还有一个是min,请你说一下这两个操作的方式作用还有他们在PPO中的意义。16.在PPO算法的损失函数设计中,cilp的操作已经能够限制策略更新的幅度确保稳定性,为什么还需要在损失计算中取原始的目标和clip的较小值?如果只保留clip部分,不取较小值会有什么问题?
查看16道真题和解析
点赞 评论 收藏
分享
评论
10
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务