小红书日常实习 推荐算法二面 45min
有面试过同岗的朋友欢迎评论区交流
1.手撕:立方根
2.为什么用树模型,没考虑DNN模型
3.怎么衡量特征重要性
4.transformer中的q、k、v怎么理解
5.计算注意力分数时为什么要除dk的平方根,了解更前沿的控制尺度的方法吗
1.手撕:立方根
2.为什么用树模型,没考虑DNN模型
3.怎么衡量特征重要性
4.transformer中的q、k、v怎么理解
5.计算注意力分数时为什么要除dk的平方根,了解更前沿的控制尺度的方法吗
全部评论
相关推荐
查看4道真题和解析 点赞 评论 收藏
分享