老实人胖虎

2021-08-06 19:49 已编辑上海大学 C++

关注

告诉你cuda共享内存的使用

想必大家都知道，cuda里面每一个block上有一块高速缓冲区，这就是提供给block里面各个线程使用的shared memory，那怎么使用这一块内存呢？

首先，shared memory分为固定分配方式和动态分配方式，就是上图的Static Shared Memory和Dynamic Shared Memory
1，固定分配
直接__shared__ int seme[5] ;这就是在每一个block里面分配5个int（20B）

__global__ void addKernel(int *c, const int *a)
{
   
	int i = threadIdx.x;
	 __shared__ int smem[5];
	smem[i] = a[i];
	__syncthreads();
	if (i == 0)	//0号线程做平方和
	{
   
		c[0] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[0] += smem[d] * smem[d];
		}
	}
	if (i == 1)//1号线程做累加
	{
   
		c[1] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[1] += smem[d];
		}
	}
	if (i == 2)	//2号线程做累乘
	{
   
		c[2] = 1;
		for (int d = 0; d<5; d++)
		{
   
			c[2] *= smem[d];
		}
	}

}

调用，启动的时候，block个数1，所以shared memory使用20B

addKernel << <1,size, 0, 0 >> >(dev_c, dev_a);

通过nsight可以看出，使用了20B的共享内存，并且是Static的；

2，动态分配
没错，就是在block里面声明，前面加上extern；

__global__ void addKernel(int *c, const int *a)
{
   
	int i = threadIdx.x;
	 extern __shared__ int smem[];
	smem[i] = a[i];
	__syncthreads();
	if (i == 0)	//0号线程做平方和
	{
   
		c[0] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[0] += smem[d] * smem[d];
		}
	}
	if (i == 1)//1号线程做累加
	{
   
		c[1] = 0;
		for (int d = 0; d<5; d++)
		{
   
			c[1] += smem[d];
		}
	}
	if (i == 2)	//2号线程做累乘
	{
   
		c[2] = 1;
		for (int d = 0; d<5; d++)
		{
   
			c[2] *= smem[d];
		}
	}

}

那在哪里指定大小呢？
原来是启动核函数的时候指定的第三个参数，之前使用多个流的时候，第四个参数绑定流的序号，第三个参数总是设为0，现在终于明白它的含义了

addKernel << <1,size, size*sizeof(int), 0 >> >(dev_c, dev_a);//第三个参数是每个block共享内存的大小

这几天正在准备写一篇关于cuda流的使用，然后会加上一些自己的学习总结，年轻，干就完了，奥利干！

CSDN博客搬运文章被收录于专栏

CSDN博客搬运

全部评论

推荐最新楼层

江南大学 C++

可以，不错哦

点赞回复分享

发布于 2021-09-30 08:44

今天 15:00

成都信息工程大学无线通信工程师

星辰天合校招

有朋友面试过星辰天合这家公司的吗？今天最后一轮cto面15分钟就结束了 面试官也没问我有什么想问的直接走了，之前有两轮技术面都面了一个多小时，是不是G了啊

点赞评论收藏

分享

05-03 21:14

门头沟学院人工智能

暑期实习（汇总）

一、互联网简历泡池子：美团、京东、蚂蚁简历挂：字节、阿里、快手、拼多多一面挂：腾讯收到offer: 智源人工智能研究院、小红书二、硬件厂一面挂：寒武纪、momenta、地平线三、总结原本计划提前离职待出租房全力找工作，但提离职时mentor和我说，可以在公司边待边找，公司里的任务不急，可以抽出一半时间准备面试，且公司里的电话亭也可以用来面试，所以我也就欣然同意了。没想到在这样的条件下，都感觉找工作页贼焦虑，有点不敢想全职找得焦虑成啥样。小红书二面后也经历了“暂不合适”，好在最后被捞起来了，然后五一前收到了书面offer，最后也是决定去这儿。离职的时候还和大家说了说投递情况，他们觉得我投递的方向...

我的求职进度条

点赞评论收藏

分享

04-27 10:43

长春理工大学 Java

完了，以后没法旷课了

大三旷课实习的难度直接翻倍😭😭

小牛炒肉：好大的官威居然不是什么官

点赞评论收藏

分享

04-15 21:48

已编辑

郑州轻工业大学 Web前端

有无大手子帮我看看简历，27届0实习，感觉起步太晚了，但又舍不得学了半学期的前端，boss一百个招呼就一个要简历的，想找个小厂实习过渡，有无建议

孤丞：前端已4️⃣

点赞评论收藏

分享

05-06 14:46

河南科技大学前端工程师

华为OD，最后offer审批没给通过，请问有赔偿吗，谁是内部人士解答一下？

问问题：华为OD，最后offer审批没给通过，请问有赔偿吗，谁是内部人士能解答一下？

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

35035次浏览 237人参与

# 实习生工资多少才算正常？ #

72964次浏览 506人参与

# 在爱玛，骑向未来 #

41724次浏览 428人参与

# 如果春招能重来，我会___ #

30974次浏览 304人参与

# 实习生的蛐蛐区 #

954022次浏览 4804人参与

# 你会因为行情，降低找工作标准吗？ #

47713次浏览 337人参与

# 美团笔试 #

996101次浏览 5853人参与

# 蚂蚁集团笔试 #

31518次浏览 149人参与

# 非技术岗投递进展 #

178719次浏览 1323人参与

# 那些我实习了才知道的事 #

294401次浏览 1813人参与

# 牛友的春节生活 #

122851次浏览 833人参与

# 你被哪些公司挂了？ #

196170次浏览 1069人参与

# 公司情报交流地 #

163461次浏览 1351人参与

# 腾讯工作体验 #

635503次浏览 3858人参与

# 记录我的毕业季 #

5538次浏览 130人参与

# 产品每日一题 #

99921次浏览 720人参与

# 快手工作体验 #

337383次浏览 2962人参与

# 选offer应该考虑哪些因素 #

171680次浏览 1052人参与

# 产品实习，你更倾向大公司or小公司 #

227691次浏览 2147人参与

# 你做过哪些dirty work #

34317次浏览 164人参与

# 26届春招投递记录 #

9087次浏览 72人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务