快手增长算法一面
约48分钟
1.自我介绍
2.项目深挖
主要挖了两个项目,一个是在学校做的深度强化学习项目,另一个是在滴滴实习时做的项目,偏因果推断。主要的问题也是围绕这两项技术展开,如马尔科夫决策过程的建模,dqn的模型结构,如何处理dqn训练不稳定的情况?reward是什么,如何加权?如果是连续的动作空间,应该如何建模,可以采用哪些模型?
如何进行特征工程(分别针对连续、离散特征),loss如何计算?如何处理GMV原值回归预测任务中训练收敛不稳定的情况?因子分解机在模型中怎么起作用?
3.手撕
字符串的排列
4.反问
问了业务特点和主要的技术方向
        1.自我介绍
2.项目深挖
主要挖了两个项目,一个是在学校做的深度强化学习项目,另一个是在滴滴实习时做的项目,偏因果推断。主要的问题也是围绕这两项技术展开,如马尔科夫决策过程的建模,dqn的模型结构,如何处理dqn训练不稳定的情况?reward是什么,如何加权?如果是连续的动作空间,应该如何建模,可以采用哪些模型?
如何进行特征工程(分别针对连续、离散特征),loss如何计算?如何处理GMV原值回归预测任务中训练收敛不稳定的情况?因子分解机在模型中怎么起作用?
3.手撕
字符串的排列
4.反问
问了业务特点和主要的技术方向
全部评论 
 相关推荐
查看5道真题和解析 点赞 评论 收藏   
分享
 