高德地图 算法 二面面经

一小时,拷打transformer
你怎么理解AIGC?
讲一下transformer
transformer和cnn的区别
transformer中embeding怎么做的
位置编码你了解哪些形式
三角函数位置编码有哪些好处,旋转位置编码呢
position embeding 和input怎么融合的
多头注意力相比单头优势,encode的时候多头会做融合吗?还是什么时候做融合?
拆成多少个头有什么规律吗?
之后的层归一化怎么实现的
前馈神经网络有几层,为什么要用mlp这种结构?
像gpt和图像生成,大都是decoder-only架构,为什么
xl参数量多少
相比于传统的模型和思路方法,为什么能达到现在这个效果,以及你怎么看待它未来的发展。
多模态模型了解哪些?
无手撕
#阿里##算法##面经##如何判断面试是否凉了##秋招#
全部评论
还挺,朴实的
1 回复 分享
发布于 2024-09-03 20:41 天津
根本答不出来
1 回复 分享
发布于 2024-09-01 03:15 浙江
大佬面的哪个岗位or部门哇~
点赞 回复 分享
发布于 2024-10-20 02:45 北京
佬蹲蹲后续
点赞 回复 分享
发布于 2024-09-27 17:23 上海
attention 拆成多少个头有什么规律吗? 请问这个有说法吗?不会
点赞 回复 分享
发布于 2024-09-23 13:23 美国
佬,XL是哪个啊?
点赞 回复 分享
发布于 2024-09-01 17:54 陕西
佬有论文吗?
点赞 回复 分享
发布于 2024-09-01 11:02 北京
太细了
点赞 回复 分享
发布于 2024-09-01 10:46 北京

相关推荐

07-29 14:37
门头沟学院 Java
点赞 评论 收藏
分享
白火同学:先说结论,准大三不是特别好找实习,boss沟通300+没有实习是很正常的情况。一是暑期实习时间太短了,二是在这么多准大四都找不到实习,从实习时间和掌握技术层面,企业会优先看他们。 再说简历,其实985本+准大三到这水平的简历也很优秀了,要说的话,项目经历可以再优化一下,可以基本围绕采取STAR原则,分为项目概述、技术架构、技术亮点、实现结果,再发给AI润色一下。 最后说操作,准大三的话,如果想找实习那就多投,不过现在也7月中旬了,时间上已经略晚了。如果7月底实在找不到,也可以多刷点算法,多学点技术,这实习也不至于一定得有,当然有更好。
点赞 评论 收藏
分享
机械打工仔:有说的你怀疑一下就行了,直接问也太实诚了
点赞 评论 收藏
分享
评论
23
105
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务