首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
课程
专栏·文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
牛客861547362号
01-31 16:42
电子信息类
关注
已关注
取消关注
#关于春招你都做了哪些准备?#
祈祷春招有好offer吧,争取每天都学一点东西
全部评论
推荐
最新
楼层
秋招专场
校招火热招聘中
官网直投
相关推荐
刻苦的斑马摆烂了
05-30 11:34
已编辑
门头沟学院 计算机类
offer选择 春招
某物流公司
软件开发岗
总包26-30
点赞
评论
收藏
转发
Shayee_
05-06 10:59
小米集团_手机软件部_软件开发工程师(准入职员工)
还是拒了
释放一个hc,心痛,我的心在滴血,emo了😭都结束了
点赞
评论
收藏
转发
汀丶人工智能
05-28 10:40
阿里巴巴_算法工程师
LLM 大模型学习必知必会系列(六):量化技术解析
LLM 大模型学习必知必会系列(六):量化技术解析、QLoRA技术、量化库介绍使用(AutoGPTQ、AutoAWQ) 模型的推理过程是一个复杂函数的计算过程,这个计算一般以矩阵乘法为主,也就是涉及到了并行计算。一般来说,单核CPU可以进行的计算种类更多,速度更快,但一般都是单条计算;而显卡能进行的都是基础的并行计算,做矩阵乘法再好不过。如果把所有的矩阵都加载到显卡上,就会导致显卡显存的占用大量增加,尤其是LLM模型大小从7b、14b、34b到几百b不等,占用显存的大小就是惊人的数字,如何在减少运算量和显存占用的条件下,做到推理效果不下降太多呢?在这里需要引入浮点数和定点数的概念。 1.量化的...
AI前沿技术
点赞
评论
收藏
转发
点赞
收藏
评论
分享
回复帖子
提到的真题
返回内容
招聘动态
查看更多
博士生招聘专场开启啦
全站热榜
1
...
给你们预测一下今年的秋招!
3179
2
...
阿里体检完还没发正式offer
2697
3
...
【🎁】25届硬件牛牛互助计划(1期)
2531
4
...
深圳蟑螂真的很可怕吗
2365
5
...
拿了蓝桥杯c++b组国二,水平怎么样,找后端开发工作有多大优势?
2348
6
...
毕业了!
2053
7
...
二本开发转测试,面试成功
1950
8
...
海康威视,25暑期实习,软件开发岗
1723
9
...
腾讯音乐还是58同城
1670
10
...
海康暑期实习
1657
正在热议
#
和牛牛一起刷题打卡
#
13531次浏览
1250人参与
#
通信硬件薪资爆料
#
255303次浏览
2404人参与
#
不去互联网可以去金融科技
#
3083次浏览
43人参与
#
牛客帮帮团来啦!有问必答
#
1090904次浏览
16284人参与
#
面试被问第一学历差时该怎么回答
#
18102次浏览
198人参与
#
简历中的项目经历要怎么写?
#
14218次浏览
187人参与
#
工作两年想退休了
#
19172次浏览
236人参与
#
实习生应该准时下班吗
#
92863次浏览
704人参与
#
你收到了团子的OC了吗
#
530376次浏览
6289人参与
#
你已经投递多少份简历了
#
338186次浏览
4904人参与
#
你怎么评价今年的春招?
#
12337次浏览
192人参与
#
简历中的项目经历要怎么写
#
481692次浏览
8755人参与
#
简历无回复,你会继续海投还是优化再投?
#
23432次浏览
328人参与
#
晒一晒我的offer
#
3767961次浏览
58035人参与
#
担心入职之后被发现很菜怎么办
#
39467次浏览
327人参与
#
本周投递记录
#
220763次浏览
5374人参与
#
硬件人的简历怎么写
#
81808次浏览
849人参与
#
我想象的工作vs实际工作
#
105682次浏览
1700人参与
#
2022毕业生求职现身说法
#
23570次浏览
338人参与
#
你的秋招进行到哪一步了
#
396489次浏览
6676人参与
#
产品人求职现状
#
56761次浏览
821人参与
牛客网
牛客企业服务