喜马拉雅搜广推算法春招二面面经

GBDT为什么叫做梯度提升决策树,梯度用在什么地方
gpt的input的encoding是怎么做的
Inmediate model的输出是什么?四个任务分别是什么?四个指标分别是什么?怎么构建的负样本?为什么是基于摘要场景训练的,但是用在对话场景呢?
svm的核函数,升维到高维空间,理论上一定可分吗
fm了不了解
unieval项目的后续应用
gpt的decoder是怎么构成的
dropout在预测时候是怎么预测的
为什么使用layernorm而不使用bn
全部评论

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务