11.04.2025 字节广告 二面面经及复盘(凉凉)
最长公共子序列 求序列?中间endpos作用?是否一定包含在最终序列中?(没跑通,时间不够寄了)
rand5实现rand10?期望次数?有优化空间吗?(最后一个没答上来)
后续复盘:
之前我答的rand5(), 若1,3则 += 0, 2,4 += 0,5重骰,这种方式无法优化
但对于rand5() * rand5(),若<= 20则直接%,这种方式有优化空间:落在21-25不重骰,直接复用作为另一个rand5
Logistic regression?为什么用CE不用MSE?(先说了极大似然估计,追问还有吗,从加上了sigmoid函数后两者梯度对比的推导)
二分类指标?解释一下AUROC?实现中怎么做?(答得离散化)
简历项目拷打,讲的强化学习
介绍一下强化学习的这些策略?
DQN -- > PG --> AC --> A2C
问GRPO的具体reward?训练过程除了你讲的多次采样还有区别吗(没答上来)
rand5实现rand10?期望次数?有优化空间吗?(最后一个没答上来)
后续复盘:
之前我答的rand5(), 若1,3则 += 0, 2,4 += 0,5重骰,这种方式无法优化
但对于rand5() * rand5(),若<= 20则直接%,这种方式有优化空间:落在21-25不重骰,直接复用作为另一个rand5
Logistic regression?为什么用CE不用MSE?(先说了极大似然估计,追问还有吗,从加上了sigmoid函数后两者梯度对比的推导)
二分类指标?解释一下AUROC?实现中怎么做?(答得离散化)
简历项目拷打,讲的强化学习
介绍一下强化学习的这些策略?
DQN -- > PG --> AC --> A2C
问GRPO的具体reward?训练过程除了你讲的多次采样还有区别吗(没答上来)
全部评论
相关推荐
10-31 10:12
门头沟学院 运维工程师 点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
