darknet/normalization__layer_8c_source.html

 #include "normalization_layer.h"
 #include "blas.h"

 #include <stdio.h>

 layer make_normalization_layer(int batch, int w, int h, int c, int size, float alpha, float beta, float kappa)
 {
     fprintf(stderr, "Local Response Normalization Layer: %d x %d x %d image, %d size\n", w,h,c,size);
     layer layer = {0};
     layer.type = NORMALIZATION;
     layer.batch = batch;
     layer.h = layer.out_h = h;
     layer.w = layer.out_w = w;
     layer.c = layer.out_c = c;
     layer.kappa = kappa;
     layer.size = size;
     layer.alpha = alpha;
     layer.beta = beta;
     layer.output = calloc(h * w * c * batch, sizeof(float));
     layer.delta = calloc(h * w * c * batch, sizeof(float));
     layer.squared = calloc(h * w * c * batch, sizeof(float));
     layer.norms = calloc(h * w * c * batch, sizeof(float));
     layer.inputs = w*h*c;
     layer.outputs = layer.inputs;

     layer.forward = forward_normalization_layer;
     layer.backward = backward_normalization_layer;
     #ifdef GPU
     layer.forward_gpu = forward_normalization_layer_gpu;
     layer.backward_gpu = backward_normalization_layer_gpu;

     layer.output_gpu =  cuda_make_array(layer.output, h * w * c * batch);
     layer.delta_gpu =   cuda_make_array(layer.delta, h * w * c * batch);
     layer.squared_gpu = cuda_make_array(layer.squared, h * w * c * batch);
     layer.norms_gpu =   cuda_make_array(layer.norms, h * w * c * batch);
     #endif
     return layer;
 }

 void resize_normalization_layer(layer *layer, int w, int h)
 {
     int c = layer->c;
     int batch = layer->batch;
     layer->h = h;
     layer->w = w;
     layer->out_h = h;
     layer->out_w = w;
     layer->inputs = w*h*c;
     layer->outputs = layer->inputs;
     layer->output = realloc(layer->output, h * w * c * batch * sizeof(float));
     layer->delta = realloc(layer->delta, h * w * c * batch * sizeof(float));
     layer->squared = realloc(layer->squared, h * w * c * batch * sizeof(float));
     layer->norms = realloc(layer->norms, h * w * c * batch * sizeof(float));
 #ifdef GPU
     cuda_free(layer->output_gpu);
     cuda_free(layer->delta_gpu);
     cuda_free(layer->squared_gpu);
     cuda_free(layer->norms_gpu);
     layer->output_gpu =  cuda_make_array(layer->output, h * w * c * batch);
     layer->delta_gpu =   cuda_make_array(layer->delta, h * w * c * batch);
     layer->squared_gpu = cuda_make_array(layer->squared, h * w * c * batch);
     layer->norms_gpu =   cuda_make_array(layer->norms, h * w * c * batch);
 #endif
 }

 void forward_normalization_layer(const layer layer, network net)
 {
     int k,b;
     int w = layer.w;
     int h = layer.h;
     int c = layer.c;
     scal_cpu(w*h*c*layer.batch, 0, layer.squared, 1);

     for(b = 0; b < layer.batch; ++b){
         float *squared = layer.squared + w*h*c*b;
         float *norms   = layer.norms + w*h*c*b;
         float *input   = net.input + w*h*c*b;
         pow_cpu(w*h*c, 2, input, 1, squared, 1);

         const_cpu(w*h, layer.kappa, norms, 1);
         for(k = 0; k < layer.size/2; ++k){
             axpy_cpu(w*h, layer.alpha, squared + w*h*k, 1, norms, 1);
         }

         for(k = 1; k < layer.c; ++k){
             copy_cpu(w*h, norms + w*h*(k-1), 1, norms + w*h*k, 1);
             int prev = k - ((layer.size-1)/2) - 1;
             int next = k + (layer.size/2);
             if(prev >= 0)      axpy_cpu(w*h, -layer.alpha, squared + w*h*prev, 1, norms + w*h*k, 1);
             if(next < layer.c) axpy_cpu(w*h,  layer.alpha, squared + w*h*next, 1, norms + w*h*k, 1);
         }
     }
     pow_cpu(w*h*c*layer.batch, -layer.beta, layer.norms, 1, layer.output, 1);
     mul_cpu(w*h*c*layer.batch, net.input, 1, layer.output, 1);
 }

 void backward_normalization_layer(const layer layer, network net)
 {
     // TODO This is approximate ;-)
     // Also this should add in to delta instead of overwritting.

     int w = layer.w;
     int h = layer.h;
     int c = layer.c;
     pow_cpu(w*h*c*layer.batch, -layer.beta, layer.norms, 1, net.delta, 1);
     mul_cpu(w*h*c*layer.batch, layer.delta, 1, net.delta, 1);
 }

 #ifdef GPU
 void forward_normalization_layer_gpu(const layer layer, network net)
 {
     int k,b;
     int w = layer.w;
     int h = layer.h;
     int c = layer.c;
     scal_gpu(w*h*c*layer.batch, 0, layer.squared_gpu, 1);

     for(b = 0; b < layer.batch; ++b){
         float *squared = layer.squared_gpu + w*h*c*b;
         float *norms   = layer.norms_gpu + w*h*c*b;
         float *input   = net.input_gpu + w*h*c*b;
         pow_gpu(w*h*c, 2, input, 1, squared, 1);

         const_gpu(w*h, layer.kappa, norms, 1);
         for(k = 0; k < layer.size/2; ++k){
             axpy_gpu(w*h, layer.alpha, squared + w*h*k, 1, norms, 1);
         }

         for(k = 1; k < layer.c; ++k){
             copy_gpu(w*h, norms + w*h*(k-1), 1, norms + w*h*k, 1);
             int prev = k - ((layer.size-1)/2) - 1;
             int next = k + (layer.size/2);
             if(prev >= 0)      axpy_gpu(w*h, -layer.alpha, squared + w*h*prev, 1, norms + w*h*k, 1);
             if(next < layer.c) axpy_gpu(w*h,  layer.alpha, squared + w*h*next, 1, norms + w*h*k, 1);
         }
     }
     pow_gpu(w*h*c*layer.batch, -layer.beta, layer.norms_gpu, 1, layer.output_gpu, 1);
     mul_gpu(w*h*c*layer.batch, net.input_gpu, 1, layer.output_gpu, 1);
 }

 void backward_normalization_layer_gpu(const layer layer, network net)
 {
     // TODO This is approximate ;-)

     int w = layer.w;
     int h = layer.h;
     int c = layer.c;
     pow_gpu(w*h*c*layer.batch, -layer.beta, layer.norms_gpu, 1, net.delta_gpu, 1);
     mul_gpu(w*h*c*layer.batch, layer.delta_gpu, 1, net.delta_gpu, 1);
 }
 #endif
layer::norms
float * norms
Definition: darknet.h:249

pow_cpu
void pow_cpu(int N, float ALPHA, float *X, int INCX, float *Y, int INCY)
Definition: blas.c:172

resize_normalization_layer
void resize_normalization_layer(layer *layer, int w, int h)
Definition: normalization_layer.c:40

layer::w
int w
Definition: darknet.h:140

blas.h

layer::forward_gpu
void(* forward_gpu)(struct layer, struct network)
Definition: darknet.h:126

layer::backward_gpu
void(* backward_gpu)(struct layer, struct network)
Definition: darknet.h:127

axpy_gpu
void axpy_gpu(int N, float ALPHA, float *X, int INCX, float *Y, int INCY)
Definition: blas_kernels.cu:585

mul_cpu
void mul_cpu(int N, float *X, int INCX, float *Y, int INCY)
Definition: blas.c:166

layer::forward
void(* forward)(struct layer, struct network)
Definition: darknet.h:123

layer::out_w
int out_w
Definition: darknet.h:141

network::delta
float * delta
Definition: darknet.h:486

layer::kappa
float kappa
Definition: darknet.h:187

layer::out_c
int out_c
Definition: darknet.h:141

mul_gpu
void mul_gpu(int N, float *X, int INCX, float *Y, int INCY)
Definition: blas_kernels.cu:607

network
Definition: darknet.h:434

layer::size
int size
Definition: darknet.h:145

forward_normalization_layer
void forward_normalization_layer(const layer layer, network net)
Definition: normalization_layer.c:66

scal_gpu
void scal_gpu(int N, float ALPHA, float *X, int INCX)
Definition: blas_kernels.cu:693

layer::h
int h
Definition: darknet.h:140

layer::delta
float * delta
Definition: darknet.h:245

layer::out_h
int out_h
Definition: darknet.h:141

layer::beta
float beta
Definition: darknet.h:186

layer::inputs
int inputs
Definition: darknet.h:134

backward_normalization_layer
void backward_normalization_layer(const layer layer, network net)
Definition: normalization_layer.c:97

axpy_cpu
void axpy_cpu(int N, float ALPHA, float *X, int INCX, float *Y, int INCY)
Definition: blas.c:178

layer::backward
void(* backward)(struct layer, struct network)
Definition: darknet.h:124

layer::batch
int batch
Definition: darknet.h:131

layer::output
float * output
Definition: darknet.h:246

scal_cpu
void scal_cpu(int N, float ALPHA, float *X, int INCX)
Definition: blas.c:184

const_cpu
void const_cpu(int N, float ALPHA, float *X, int INCX)
Definition: blas.c:160

make_normalization_layer
layer make_normalization_layer(int batch, int w, int h, int c, int size, float alpha, float beta, float kappa)
Definition: normalization_layer.c:6

copy_gpu
void copy_gpu(int N, float *X, int INCX, float *Y, int INCY)
Definition: blas_kernels.cu:602

layer::alpha
float alpha
Definition: darknet.h:185

layer::c
int c
Definition: darknet.h:140

copy_cpu
void copy_cpu(int N, float *X, int INCX, float *Y, int INCY)
Definition: blas.c:226

detector-scipy-opencv.net
net
Definition: detector-scipy-opencv.py:39

layer::type
LAYER_TYPE type
Definition: darknet.h:120

network::input
float * input
Definition: darknet.h:484

NORMALIZATION
Definition: darknet.h:75

layer
struct layer layer
Definition: darknet.h:117

normalization_layer.h

layer::squared
float * squared
Definition: darknet.h:248

layer::outputs
int outputs
Definition: darknet.h:135

const_gpu
void const_gpu(int N, float ALPHA, float *X, int INCX)
Definition: blas_kernels.cu:674

pow_gpu
void pow_gpu(int N, float ALPHA, float *X, int INCX, float *Y, int INCY)
Definition: blas_kernels.cu:590

layer
Definition: darknet.h:119