快手大模型算法一轮挂喜提人才库

攒人品中!!!
1. attention中数据shape是batch first还是seq_len first
2. Prompt长度加倍,首token延迟加倍吗
3. 模型选型时是否做定性定量对比ab test,客观数据验证文心性能不好了吗
4. SFT过程中遇到了哪些问题和解决方案?
5. 如何定性定量评估数据集质量,单条和整体数据集质量?
6. 单一分类模型,细分分类模型和MOE融合的优劣。

7. MHA手写
全部评论
考虑我多实习吗?部门核心,负责主站搜广推业务,hc较多,转正概率高,感兴趣点我主页了解详情
点赞 回复 分享
发布于 今天 20:28 上海

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务