11.04.2025 字节广告 二面面经及复盘(凉凉)

最长公共子序列 求序列?中间endpos作用?是否一定包含在最终序列中?(没跑通,时间不够寄了)

rand5实现rand10?期望次数?有优化空间吗?(最后一个没答上来)

后续复盘:

之前我答的rand5(), 若1,3则 += 0, 2,4 += 0,5重骰,这种方式无法优化
但对于rand5() * rand5(),若<= 20则直接%,这种方式有优化空间:落在21-25不重骰,直接复用作为另一个rand5

Logistic regression?为什么用CE不用MSE?(先说了极大似然估计,追问还有吗,从加上了sigmoid函数后两者梯度对比的推导)

二分类指标?解释一下AUROC?实现中怎么做?(答得离散化)

简历项目拷打,讲的强化学习

介绍一下强化学习的这些策略?

DQN -- > PG --> AC --> A2C

问GRPO的具体reward?训练过程除了你讲的多次采样还有区别吗(没答上来)
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务