首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
eternityer
获赞
23
粉丝
2
关注
4
看过 TA
150
男
门头沟学院
2024
Java
IP属地:江苏
加油
私信
关注
拉黑
举报
举报
确定要拉黑eternityer吗?
发布(2)
评论
刷题
收藏
eternityer
关注TA,不错过内容更新
关注
2023-11-03 10:15
门头沟学院 Java
大语言模型问题求解
现在为什么大语言模型都是decoder-only。😭
飞尘暮光:
非要找个理由的话:decoder-only采用的是因果注意力机制,causal attention mask保证了attention score一定是满秩的,而bi-direction attention mask,也就是encoder里所用的不能保证满秩。显而易见,参数矩阵的秩和它的学习能力是相关的。所以decoder-only架构潜力更大,因此也需要更多的数据才训练,模型做大的时候,它的capability是随着尺寸变大有着一个稳定增长。 实际情况:海量数据+更强的训练工程。
0
点赞
评论
收藏
分享
2023-11-02 09:52
门头沟学院 Java
极氪面试
吉利极氪算法工程师岗(智能互联网中心)一面面啥? 突然收到明天面试通知,是不是kpi面?😅
投递吉利汽车分公司等公司7个岗位
0
点赞
评论
收藏
分享
1
创作者周榜
更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务