字节一面

攒人品~大模型岗位

深挖论文项目,如何构建的数据集,评价指标,置信度的考虑,rag怎么做的,prompt怎么写的。
bert的input词向量和其他大模型的区别,transformer的MHA之后的FFN是如何训练的。
手撕最长无重复子串。
反问业务。

希望别挂
全部评论

相关推荐

Java面试先知:我也是和你一样的情况,hr 说等开奖就行了
点赞 评论 收藏
分享
牛客41406533...:回答他在课上学,一辈子待在学校的老教授用三十年前的祖传PPT一字一句的讲解,使用谭浩强红皮书作为教材在devc++里面敲出a+++++a的瞬间爆出114514个编译错误来学这样才显得专业
点赞 评论 收藏
分享
评论
1
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务