首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
代码阅读
#
代码阅读
#
567次浏览
2人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
05-20 16:50
上海交通大学 搜索算法
模型注意力代码完全看不懂怎么下手理解
这种重写注意力机制的 forward 代码完全看不懂怎么着手去理解看论文已经知道了它的原理,计算公式,改动的项他这里只实现了两种模型的,如果想去适配qwen模型,从何下手开头注释里写了依赖了两个项目 https://github.com/microsoft/KBLaM/blob/main/src/kblam/models/llama3_model.py
点赞
评论
收藏
分享
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
那些年,我收到的‘奇葩’回复
0
2
...
材料转码还有必要吗?
0
1
...
小红书开奖了
3
...
OC/开奖
0
4
...
实习学到最有价值的工作习惯
0
5
...
职场中那些令人叹为观止的八卦
0
1
...
腾讯音乐秋招
6
...
蚂蚁求职进展汇总
0
7
...
为了秋招你都做了哪些准备?
0
8
...
你知道哪些职场黑话?
0
9
...
材料人,你最希望上岸的是?
0
10
...
哪些行业值得去?
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务