首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
忙碌的杰克在看面经
上海开放大学 FPGA工程师
关注
已关注
取消关注
加油,创业吧,程序员
来晚一步,该内容已经被删除了o(T_T)o
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
12-22 21:57
武汉大学 Java
20251222【字节】面试算法真题(共2题)
题目1:求一个字符串的最长无重复字符子字符串长度题目2:长度最小的子数组
点赞
评论
收藏
分享
12-18 20:29
门头沟学院 人工智能
大模型推理加速:KVCache和Pageattendtion
首先声明不搞infra的不用看,我现在看底层了,本篇内容基于Efficient Memory Management for Large Language Model Serving with PagedAttention》 (SOSP 2023)出处: 加州大学伯克利分校(UC Berkeley)这篇里面讲了vllm,那么我们就先讲vllm。LLM 模型在推理阶段的显存有三部份组成:模型权重、KVCache 显存占用以及激活值显存占用。而今天我们是速成教程,所以又要体现深度,那么就先讲KVCache,这个本质上是一种通用的思路就是减少k,v的计算,采用缓存的机制去减少中间值,而这个的问题是kv...
机器学习,推理优化,芯片...
点赞
评论
收藏
分享
12-01 18:27
已编辑
湖南科技大学 后端工程师
还愿
感谢度子,下辈子还跟你
点赞
评论
收藏
分享
12-18 17:24
浙江大学 Java
微信发红包场景测试设计。
图解测试用例设计-牛客面...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
26届双非本鼠硕拿下5个ssp的秋招总结及一条龙经验分享
9636
2
...
【25年终总结】-牛客运营团队
4076
3
...
实习没事做是福还是祸?
3593
4
...
大二混子终于找到实习了...
2789
5
...
【求助】被hr骂“刷子”什么意思?
2426
6
...
尼克狐尼克,你被捕了
2099
7
...
关于我小心翼翼触碰安全红线这件事
1927
8
...
学校发力了,没招了牛友们
1879
9
...
校招入职半年之后又回到了这个地方
1811
10
...
快手昨晚是咋了,有无懂牛?
1604
创作者周榜
更多
正在热议
更多
#
2025年终总结
#
147478次浏览
2517人参与
#
秋招落幕,你是He or Be
#
3200次浏览
76人参与
#
应届生进小公司有什么影响吗
#
109074次浏览
1116人参与
#
比亚迪工作体验
#
70152次浏览
254人参与
#
你面试体验感最差/最好的公司
#
3023次浏览
56人参与
#
工作中听到最受打击的一句话
#
2523次浏览
61人参与
#
大厂VS公务员你怎么选
#
71150次浏览
660人参与
#
重来一次,你会对开始求职的自己说
#
2958次浏览
71人参与
#
一人说一个提前实习的好处
#
3340次浏览
70人参与
#
团建是“福利”还是是 “渡劫”
#
4014次浏览
110人参与
#
实习没事做是福还是祸?
#
8253次浏览
135人参与
#
如何排解工作中的焦虑
#
243776次浏览
2241人参与
#
从顶到拉给所有面过的公司评分
#
144795次浏览
518人参与
#
今年你最想重开的一场面试是?
#
1403次浏览
25人参与
#
你小心翼翼的闯过多大的祸?
#
6917次浏览
109人参与
#
联影求职进展汇总
#
123830次浏览
781人参与
#
OPPO求职进展汇总
#
755894次浏览
5390人参与
#
互联网公司爆料
#
158574次浏览
724人参与
#
产品实习,你更倾向大公司or小公司
#
189095次浏览
2053人参与
#
秋招结束之后的日子
#
113910次浏览
1039人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务