首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
代码阅读
#
代码阅读
#
439次浏览
2人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
05-20 16:50
上海交通大学 搜索算法
模型注意力代码完全看不懂怎么下手理解
这种重写注意力机制的 forward 代码完全看不懂怎么着手去理解看论文已经知道了它的原理,计算公式,改动的项他这里只实现了两种模型的,如果想去适配qwen模型,从何下手开头注释里写了依赖了两个项目 https://github.com/microsoft/KBLaM/blob/main/src/kblam/models/llama3_model.py
点赞
评论
收藏
分享
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
牛油的搬砖plog
0
2
...
机械人求职现状
0
1
...
深信服秋招来了
3
...
三一集团求职进展汇总
0
4
...
金融财经春招备战日记
0
5
...
中广核工作体验
0
1
...
携程求职进展汇总
6
...
你觉得现在还能进互联网吗?
0
7
...
机械人的offer怎么选
0
8
...
考公VS就业,你怎么选?
0
9
...
你的实习什么时候入职
0
10
...
产运销实习日记
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务