字节跳动校招推荐算法一面凉经
- 自我介绍
- 介绍强化学习实习项目
- reward怎么设的,state是什么,action是什么,为什么用强化学习
- TD时序差分是什么, TD和蒙特卡洛的区别是什么
- 推导贝尔曼方程,贝尔曼方程里的gamma如果设成1会怎么样,设成0的话与监督学习有区别吗
- 样本不均衡的解决方法有哪些,focal loss的原理
- 手写堆排序
相关推荐
查看23道真题和解析
哈哈哈,你是老六:就这不去的人大把人干呢,现在不缺人干活,你不干大把干呢,还有那个说农民工赚钱的,那个800+我估计肯定也就那一段时间,哪有这么赚钱,还是一句话,要想存下钱必须花销极低,能省的就不花钱,工资要高点
eta!0413:百度:我们只是在“优化用户体验”🙃