为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

cuda初始化代码

2017-11-12 8页 doc 22KB 15阅读

用户头像

is_105949

暂无简介

举报
cuda初始化代码cuda初始化代码 #include #include bool CUDA_initial(void) { int i; int device_count; if( cudaGetDeviceCount(&device_count) ) { printf(" There is zero device beyond 1.0\n"); return false; } else printf("There is %d device beyond 1.0\n",device_count); for(i=...
cuda初始化代码
cuda初始化代码 #include #include bool CUDA_initial(void) { int i; int device_count; if( cudaGetDeviceCount(&device_count) ) { printf(" There is zero device beyond 1.0\n"); return false; } else printf("There is %d device beyond 1.0\n",device_count); for(i=0;i报告
9999种主要和次要计算能力。 返回值 相关返回值: cudaSuccess 注意,如果之前是异步启动,该函数可能返回错误码。 1.1.2 cudaSetDevice 名称 cudaSetDevice – 设置设备以供GPU执行使用 概要 cudaError_t cudaSetDevice(int dev) 说明 将dev记录为活动主线程将执行设备码的设备。 返回值 相关返回值: cudaSuccess cudaErrorInvalidDevice 注意,如果之前是异步启动,该函数可能返回错误码。 1.1.3 cudaGetDevice 名称 cudaGetDevice – 返回当前使用的设备 概要 cudaError_t cudaGetDevice(int *dev) 说明 以*dev形式返回活动主线程执行设备码的设备。 返回值 相关返回值 cudaSuccess 注意,如果之前是异步启动,该函数可能返回错误码。 1.1.4 cudaGetDeviceProperties 名称 cudaGetDeviceProperties – 返回关于计算设备的信息 概要 cudaError_t cudaGetDeviceProperties( struct cudaDeviceProp* prop,int dev ) 说明 以*prop形式返回设备dev的属性。cudaDeviceProp结构定义如下: struct cudaDeviceProp { char name [256]; size_t totalGlobalMem; size_t sharedMemPerBlock; int regsPerBlock; int warpSize; size_t memPitch; int maxThreadsPerBlock; int maxThreadsDim [3]; int maxGridSize [3]; size_t totalConstMem; int major; int minor; int clockRate; size_t textureAlignment; int deviceOverlap; int multiProcessorCount; } 其中: name 用于标识设备的ASCII字符串; totalGlobalMem 设备上可用的全局存储器的总量,以字节为单位; sharedMemPerBlock 线程块可以使用的共享存储器的最大值,以字节为单位;多处理器上的所有线程块可以同时 共享这些存储器; regsPerBlock 线程块可以使用的32位寄存器的最大值;多处理器上的所有线程块可以同时共享这些寄存 器; warpSize 按线程计算的warp块大小; memPitch 允许通过cudaMallocPitch()为包含存储器区域的存储器复制函数分配的最大间距(pitch), 以字节为单位; maxThreadsPerBlock 每个块中的最大线程数: maxThreadsDim[3] 块各个维度的最大值: maxGridSize[3] 网格各个维度的最大值; totalConstMem 设备上可用的不变存储器总量,以字节为单位; major,minor 定义设备计算能力的主要修订号和次要修订号; clockRate 以千赫为单位的时钟频率; textureAlignment 对齐要求;与textureAlignment字节对齐的纹理基址无需对纹理取样应用偏移; deviceOverlap 如果设备可在主机和设备之间并发复制存储器,同时又能执行内核,则此值为 1;否则此值 为 0; multiProcessorCount 设备上多处理器的数量。 返回值 相关返回值: cudaSuccess cudaErrorInvalidDevice 注意,如果之前是异步启动,该函数可能返回错误码。
/
本文档为【cuda初始化代码】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索