2024届暑期实习蚂蚁一面面经(AIGC)
1. 论文细节(模型是怎么工作的, 各个模块的作用,怎么选择损失函数等)。
2. 防止过拟合的方法。
3. 几种优化器的区别。
4. 交叉熵函数是怎么计算的以及其物理意义。
5. 图像怎么作为序列信息输入transformer。
6. 为什么选择patch的方式,有什么意义。
7. 你平时有没有遇到过梯度爆炸的现象,解释其产生的原因(怎么根据链式法则解释)
(目前想到的就这些,后续想起来会在评论区更新)
coding:快排
#我的实习求职记录#1. 论文细节(模型是怎么工作的, 各个模块的作用,怎么选择损失函数等)。
2. 防止过拟合的方法。
3. 几种优化器的区别。
4. 交叉熵函数是怎么计算的以及其物理意义。
5. 图像怎么作为序列信息输入transformer。
6. 为什么选择patch的方式,有什么意义。
7. 你平时有没有遇到过梯度爆炸的现象,解释其产生的原因(怎么根据链式法则解释)
(目前想到的就这些,后续想起来会在评论区更新)
coding:快排
#我的实习求职记录#相关推荐
程序员花海:1.面试要求必须Java笔试不一定
2.难度对等秋招 远超于日常实习是因为同一批次且转正很多 竞争压力大
3.第一个加点指标,上线了就把接口性能加上去 使用本地缓存这个不算亮点 只是技术选型,要把为什么采用这个和背后的思考写出来而不是单纯堆叠技术没意义
4.八股要一直看 很容易忘记
5.拼团交易这个老问题 堆积技术 另外建议你把奖项合并到教育背景 没必要拆出来放最后