小红书日常实习 推荐算法二面 45min

有面试过同岗的朋友欢迎评论区交流
1.手撕:立方根
2.为什么用树模型,没考虑DNN模型
3.怎么衡量特征重要性
4.transformer中的q、k、v怎么理解
5.计算注意力分数时为什么要除dk的平方根,了解更前沿的控制尺度的方法吗
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务