首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
代码阅读
#
代码阅读
#
1145次浏览
2人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
2025-05-20 16:50
上海交通大学 搜索算法
模型注意力代码完全看不懂怎么下手理解
这种重写注意力机制的 forward 代码完全看不懂怎么着手去理解看论文已经知道了它的原理,计算公式,改动的项他这里只实现了两种模型的,如果想去适配qwen模型,从何下手开头注释里写了依赖了两个项目 https://github.com/microsoft/KBLaM/blob/main/src/kblam/models/llama3_model.py
点赞
评论
收藏
分享
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
我的求职总结
0
2
...
投格力的你,拿到offer了吗?
0
3
...
27届实习投递记录
0
4
...
我是XXX,请攻击我最薄弱的地方
0
5
...
26届春招投递记录
0
6
...
中电科13所进度交流
0
7
...
风评不好的公司,你会去吗?
0
8
...
哪一瞬间让你觉得“这班不如不上”
0
9
...
入职第四天,心情怎么样
0
10
...
拼多多工作体验
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务