校招面试真题,考前押题,这还不学起来!

1/transformer 的模型结构?手撕transformer伪代码,
为什么用layer norm、缩放点积、多头注意力?
2/transformer序列建模与din序列建模有什么异同?不同 attention的方式有哪些,有什么区别,各有什么优劣?
3/针对长序列建模哪些方法?

1、这三个题目主要针对搜推广场景中作用最大的模型结构之一的序列建模,对应的渐进式提问
2、第一问考察同学对基础模型结构、原理的掌握,对各个部分作用的理解
3、第二问考察同学对于两种常用序列建模方式的比较和思考,扩展对于不同attention的优劣势
4、第三问从短序列扩展到近两年常用的长序列建模,考察同学的知识面以及对最新技术的敏感度

面试建议

1、对各个经典模型细节要有深入的了解和思考,每个模型结构设计的动机,解决了什么问题
2、在结合自己项目时,讲清与通用方案的比较,项目中的亮点,以及可以提升的空间
3、对于自己的方向,时刻保持对新技术、新趋势的敏感性

我这里还有更多25届大厂&独角兽校招内推汇总-定期更新,建议收藏,内推求职更高效!
https://docs.qq.com/doc/DZmtPRU5idVRTQnZF
全部评论

相关推荐

lllllkin:感觉可以精简到一页简历,有些排版感觉不是必须的。 时间线越早的,你自己越熟悉的放前面。描述可以更精简些,一些问题解决感觉可以不用写具体技术栈,卖个关子,等面试官问。
点赞 评论 收藏
分享
野猪不是猪🐗:我assume that你must技术aspect是solid的,temperament也挺good的,however面试不太serious,generally会feel style上不够sharp
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务