cuda初始化代码cuda初始化代码
#include
#include
bool CUDA_initial(void)
{
int i;
int device_count;
if( cudaGetDeviceCount(&device_count) )
{
printf(" There is zero device beyond 1.0\n");
return false;
}
else
printf("There is %d device beyond 1.0\n",device_count);
for(i=...
cuda初始化代码
#include
#include
bool CUDA_initial(void)
{
int i;
int device_count;
if( cudaGetDeviceCount(&device_count) )
{
printf(" There is zero device beyond 1.0\n");
return false;
}
else
printf("There is %d device beyond 1.0\n",device_count);
for(i=0;i报告9999种主要和次要计算能力。
返回值
相关返回值:
cudaSuccess
注意,如果之前是异步启动,该函数可能返回错误码。
1.1.2 cudaSetDevice
名称
cudaSetDevice – 设置设备以供GPU执行使用
概要
cudaError_t cudaSetDevice(int dev)
说明
将dev记录为活动主线程将执行设备码的设备。
返回值
相关返回值:
cudaSuccess
cudaErrorInvalidDevice
注意,如果之前是异步启动,该函数可能返回错误码。
1.1.3 cudaGetDevice
名称
cudaGetDevice – 返回当前使用的设备
概要
cudaError_t cudaGetDevice(int *dev)
说明
以*dev形式返回活动主线程执行设备码的设备。
返回值
相关返回值
cudaSuccess
注意,如果之前是异步启动,该函数可能返回错误码。
1.1.4 cudaGetDeviceProperties 名称
cudaGetDeviceProperties – 返回关于计算设备的信息
概要
cudaError_t cudaGetDeviceProperties( struct cudaDeviceProp* prop,int dev )
说明
以*prop形式返回设备dev的属性。cudaDeviceProp结构定义如下:
struct cudaDeviceProp { char name [256];
size_t totalGlobalMem; size_t sharedMemPerBlock; int regsPerBlock;
int warpSize;
size_t memPitch;
int maxThreadsPerBlock; int maxThreadsDim [3]; int maxGridSize [3]; size_t totalConstMem; int major;
int minor;
int clockRate;
size_t textureAlignment; int deviceOverlap; int multiProcessorCount;
}
其中:
name
用于标识设备的ASCII字符串;
totalGlobalMem
设备上可用的全局存储器的总量,以字节为单位;
sharedMemPerBlock
线程块可以使用的共享存储器的最大值,以字节为单位;多处理器上的所有线程块可以同时
共享这些存储器;
regsPerBlock
线程块可以使用的32位寄存器的最大值;多处理器上的所有线程块可以同时共享这些寄存
器;
warpSize
按线程计算的warp块大小;
memPitch
允许通过cudaMallocPitch()为包含存储器区域的存储器复制函数分配的最大间距(pitch),
以字节为单位;
maxThreadsPerBlock
每个块中的最大线程数:
maxThreadsDim[3]
块各个维度的最大值:
maxGridSize[3]
网格各个维度的最大值;
totalConstMem
设备上可用的不变存储器总量,以字节为单位; major,minor
定义设备计算能力的主要修订号和次要修订号; clockRate
以千赫为单位的时钟频率;
textureAlignment
对齐要求;与textureAlignment字节对齐的纹理基址无需对纹理取样应用偏移;
deviceOverlap
如果设备可在主机和设备之间并发复制存储器,同时又能执行内核,则此值为 1;否则此值
为 0;
multiProcessorCount
设备上多处理器的数量。
返回值
相关返回值:
cudaSuccess
cudaErrorInvalidDevice
注意,如果之前是异步启动,该函数可能返回错误码。
本文档为【cuda初始化代码】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。