京东llm一面凉经

LLM:数据集构造、是否出现DPO不收敛?或者DPO后的效果不如SFT?
数据建模中特征有什么?获取渠道?
XGB介绍
为什么不用DNN?为什么不对离散特征做embedding?
负样本采样,随便采样吗?
控制正负样本比例的方法有哪些?
code: 最长回文子串
全部评论

相关推荐

点赞 评论 收藏
分享
03-28 20:13
东南大学 Java
2的三次幂:第一个项目写的太简略了,可以结合业务背景写下细节,第二个太冗余了,缺乏量化指标,一眼玩具
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务