得物策略二面
#得物校招求职汇总# 八股:
1、多分类任务用的loss函数?(交叉熵)
2、在transformer中预测下一个token这样的任务中,交叉熵的计算它的真实分布是什么,预测分布是什么,怎么计算?
3、写一下二分类的交叉熵函数计算
4、大模型的训练有无了解?
场景题:给一个数组(比如[5,10,15]),对其随机采样,如何能最大概率地采到数组最大值,返回其下标。(另写一个数组,5个1,10个2,15个3,重复下标,就能最大概率采样到15的下标)
#得物##得物二面##得物策略#
1、多分类任务用的loss函数?(交叉熵)
2、在transformer中预测下一个token这样的任务中,交叉熵的计算它的真实分布是什么,预测分布是什么,怎么计算?
3、写一下二分类的交叉熵函数计算
4、大模型的训练有无了解?
场景题:给一个数组(比如[5,10,15]),对其随机采样,如何能最大概率地采到数组最大值,返回其下标。(另写一个数组,5个1,10个2,15个3,重复下标,就能最大概率采样到15的下标)
#得物##得物二面##得物策略#
全部评论
大佬,请问大模型的训练有无了解,主要是回答什么呀
你好,请问你一面是什么时候啊?
纯问八股 项目不问的嘛
相关推荐
点赞 评论 收藏
分享
05-29 17:59
东南大学 Java 一纸丿繁华丶:我今天问了,回复说是已经有更好的人接了offer,暂时不会推进。但是官网没有挂,还是面试中,估计只有前面的人毁约了才可能轮到我。你可能也是这情况,排序前面的前两天就已经发offer了,后面都是备胎。
点赞 评论 收藏
分享