darknet/avgpool__layer__kernels_8cu_source.html

 #include "cuda_runtime.h"
 #include "curand.h"
 #include "cublas_v2.h"

 extern "C" {
 #include "avgpool_layer.h"
 #include "cuda.h"
 }

 __global__ void forward_avgpool_layer_kernel(int n, int w, int h, int c, float *input, float *output)
 {
     int id = (blockIdx.x + blockIdx.y*gridDim.x) * blockDim.x + threadIdx.x;
     if(id >= n) return;

     int k = id % c;
     id /= c;
     int b = id;

     int i;
     int out_index = (k + c*b);
     output[out_index] = 0;
     for(i = 0; i < w*h; ++i){
         int in_index = i + h*w*(k + b*c);
         output[out_index] += input[in_index];
     }
     output[out_index] /= w*h;
 }

 __global__ void backward_avgpool_layer_kernel(int n, int w, int h, int c, float *in_delta, float *out_delta)
 {
     int id = (blockIdx.x + blockIdx.y*gridDim.x) * blockDim.x + threadIdx.x;
     if(id >= n) return;

     int k = id % c;
     id /= c;
     int b = id;

     int i;
     int out_index = (k + c*b);
     for(i = 0; i < w*h; ++i){
         int in_index = i + h*w*(k + b*c);
         in_delta[in_index] += out_delta[out_index] / (w*h);
     }
 }

 extern "C" void forward_avgpool_layer_gpu(avgpool_layer layer, network net)
 {
     size_t n = layer.c*layer.batch;

     forward_avgpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.w, layer.h, layer.c, net.input_gpu, layer.output_gpu);
     check_error(cudaPeekAtLastError());
 }

 extern "C" void backward_avgpool_layer_gpu(avgpool_layer layer, network net)
 {
     size_t n = layer.c*layer.batch;

     backward_avgpool_layer_kernel<<<cuda_gridsize(n), BLOCK>>>(n, layer.w, layer.h, layer.c, net.delta_gpu, layer.delta_gpu);
     check_error(cudaPeekAtLastError());
 }

layer::w
int w
Definition: darknet.h:140

forward_avgpool_layer_kernel
__global__ void forward_avgpool_layer_kernel(int n, int w, int h, int c, float *input, float *output)
Definition: avgpool_layer_kernels.cu:10

network
Definition: darknet.h:434

layer::h
int h
Definition: darknet.h:140

layer::batch
int batch
Definition: darknet.h:131

backward_avgpool_layer_kernel
__global__ void backward_avgpool_layer_kernel(int n, int w, int h, int c, float *in_delta, float *out_delta)
Definition: avgpool_layer_kernels.cu:29

avgpool_layer.h

cuda.h

layer::c
int c
Definition: darknet.h:140

detector-scipy-opencv.net
net
Definition: detector-scipy-opencv.py:39

forward_avgpool_layer_gpu
void forward_avgpool_layer_gpu(avgpool_layer layer, network net)
Definition: avgpool_layer_kernels.cu:46

backward_avgpool_layer_gpu
void backward_avgpool_layer_gpu(avgpool_layer layer, network net)
Definition: avgpool_layer_kernels.cu:54

layer
Definition: darknet.h:119