阿里(晚上刚面完三面等结果中) 一面: 问做什么的:强化学习深度学习 问项目创新点:多智能体+分层算法架构,联盟学习selfplay学习结构 熟不熟悉机器学习?还可以 决策树的划分标准是什么?三种决策树信息增益,增益比,基尼index 方差和偏差,bagging和boosting,adaboost损失函数,随机森林哪两个随机,bootstrap怎么做的,有放回吗。 xgboost的正则化项,lgbm和xgb的对比。 算法题口述一下思路:员工有一个登记打卡时间有一个id,找到某一天入职的新员工的id 反问:业务和评价 二面: 强化学习为什么在游戏领域应用广泛:扯了下mdp和容易...